Question

我使用了与文档中相同的代码，并且使用设置实例化Crawlrunner，以便它不会错过管道操作。如果没有使用它，它将正常工作，但将跳过管道。< / p>

from twisted.internet import reactor
import scrapy
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
from forspef_scrapper import ForspefScrapper
from scrapy.utils.project import get_project_settings

configure_logging({'LOG_FORMAT': '%(levelname)s: %(message)s'})
runner = CrawlerRunner(get_project_settings())

d = runner.crawl(ForspefScrapper)
d.addBoth(lambda _: reactor.stop())
reactor.run()

请说明原因和可能的解决方法。

Answer 1

删除reactor.stop的回调，您不应再看到该问题了。反应堆设计为始终运行

在scrapy中使用CrawlerRunner的ReactorNotRestartable错误

1 个答案: