在scrapy中使用CrawlerRunner的ReactorNotRestartable错误

时间:2017-05-25 09:26:41

标签: python scrapy twisted

我使用了与文档中相同的代码,并且使用设置实例化Crawlrunner,以便它不会错过管道操作。如果没有使用它,它将正常工作,但将跳过管道。< / p>

from twisted.internet import reactor
import scrapy
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
from forspef_scrapper import ForspefScrapper
from scrapy.utils.project import get_project_settings

configure_logging({'LOG_FORMAT': '%(levelname)s: %(message)s'})
runner = CrawlerRunner(get_project_settings())

d = runner.crawl(ForspefScrapper)
d.addBoth(lambda _: reactor.stop())
reactor.run()

请说明原因和可能的解决方法。

1 个答案:

答案 0 :(得分:0)

删除reactor.stop的回调,您不应再看到该问题了。反应堆设计为始终运行