我使用了与文档中相同的代码,并且使用设置实例化Crawlrunner,以便它不会错过管道操作。如果没有使用它,它将正常工作,但将跳过管道。< / p>
from twisted.internet import reactor
import scrapy
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
from forspef_scrapper import ForspefScrapper
from scrapy.utils.project import get_project_settings
configure_logging({'LOG_FORMAT': '%(levelname)s: %(message)s'})
runner = CrawlerRunner(get_project_settings())
d = runner.crawl(ForspefScrapper)
d.addBoth(lambda _: reactor.stop())
reactor.run()
请说明原因和可能的解决方法。
答案 0 :(得分:0)
删除reactor.stop
的回调,您不应再看到该问题了。反应堆设计为始终运行