在Scrapy中获取所有蜘蛛类名称

时间:2017-10-22 06:24:08

标签: python web-scraping scrapy

在旧版本中,我们可以使用以下代码获取蜘蛛列表(蜘蛛名称),但在当前版本(1.4)中我遇到了

[py.warnings] WARNING: run-all-spiders.py:17: ScrapyDeprecationWarning: CrawlerRunner.spiders attribute is renamed to CrawlerRunner.spider_loader.
for spider_name in process.spiders.list():
    # list all the available spiders in my project

使用crawler.spiders.list()

>>> for spider_name in crawler.spiders.list():
...     print(spider_name)

如何在Scrapy中获取蜘蛛列表(和等效的类名)?

1 个答案:

答案 0 :(得分:6)

我在我的实用程序脚本中使用它来运行蜘蛛:

from scrapy import spiderloader
from scrapy.utils import project

settings = project.get_project_settings()
spider_loader = spiderloader.SpiderLoader.from_settings(settings)
spiders = spider_loader.list()
classes = [spider_loader.load(name) for name in spiders]

在您的情况下,按照警告信息的建议,将spiders重命名为spider_loader就足够了。