文件 · master · 考古学家lx(李玺) / asyncpy · GitCode

pip install asyncpy
ERROR: Could not find a version that satisfies the requirement asyncpy (from versions: none)
ERROR: No matching distribution found for asyncpy
asyncpy genspider demo
import settings
class DemoSpider(Spider):
    name = 'demo'
    start_urls = []
    settings_attr = settings
class DemoSpider2(Spider):
    name = 'demo2'

    start_urls = []

    concurrency = 30                                # 并发数量

    custom_settings = {
        "RETRIES": 1,                               # 重试次数
        "DOWNLOAD_DELAY": 0,                        # 下载延时
        "RETRY_DELAY": 0,                           # 重试延时
        "DOWNLOAD_TIMEOUT": 10,                     # 超时时间
        "LOG_FILE":"demo2.log"						# 日志文件
            }
LOG_FILE = './asyncpy.log'
LOG_LEVEL = 'DEBUG'
from asyncpy.middleware import Middleware

middleware = Middleware()

@middleware.request
async def UserAgentMiddleware(spider, request):
    if request.meta.get('valid'):
        print("当前爬虫名称:%s"%spider.name)
        ua = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3100.0 Safari/537.36"
        request.headers.update({"User-Agent": ua})


@middleware.request
async def ProxyMiddleware(spider, request):
    if spider.name == 'demo':
        request.aiohttp_kwargs.update({"proxy": "http://123.45.67.89:0000"})
MIDDLEWARE = [
'demo_middleware.middleware',
            ]
from middlewares import middleware
DemoSpider.start(middleware=middleware)
	 item = {}
	 item['response'] = response.text
	 item['datetime'] = '2020-05-21 13:14:00'
	 yield item
class SpiderPipeline():

    def __init__(self):
        pass

    def process_item(self, item, spider_name):
        pass
PIPELINES = [
'pipelines.SpiderPipeline',
            ]
from pipelines import SpiderPipeline
DemoSpider.start(pipelines=SpiderPipeline)
DemoSpider.start()
from Demo.demo import DemoSpider
from Demo.demo2 import DemoSpider2
import multiprocessing

def open_DemoSpider2():
    DemoSpider2.start()

def open_DemoSpider():
    DemoSpider.start()

if __name__ == "__main__":
    p1 = multiprocessing.Process(target = open_DemoSpider)
    p2 = multiprocessing.Process(target = open_DemoSpider2)
    p1.start()
    p2.start()