在旧版本中,我们可以使用以下代码获取蜘蛛列表(蜘蛛名称),但在当前版本(1.4)中我遇到了
[py.warnings] WARNING: run-all-spiders.py:17: ScrapyDeprecationWarning: CrawlerRunner.spiders attribute is renamed to CrawlerRunner.spider_loader.
for spider_name in process.spiders.list():
# list all the available spiders in my project
使用crawler.spiders.list()
:
>>> for spider_name in crawler.spiders.list():
... print(spider_name)
如何在Scrapy中获取蜘蛛列表(和等效的类名)?
答案 0 :(得分:6)
我在我的实用程序脚本中使用它来运行蜘蛛:
from scrapy import spiderloader
from scrapy.utils import project
settings = project.get_project_settings()
spider_loader = spiderloader.SpiderLoader.from_settings(settings)
spiders = spider_loader.list()
classes = [spider_loader.load(name) for name in spiders]
在您的情况下,按照警告信息的建议,将spiders
重命名为spider_loader
就足够了。