Question

有谁知道如何在不同的网站上运行相同的Scrapy刮刀超过200次，每个网站都有各自的输出文件？通常在Scrapy中，通过键入-o filename.json.

从命令行运行输出文件时指示输出文件

Answer 1

多种方式：

Answer 2

我做了类似的事情。这就是我所做的：

像往常一样编写抓取工具，但请务必实施feed exports。我有Feed导出将结果直接推送到S3存储桶。此外，我建议您接受该网站作为脚本的命令行参数。（Example here）
设置scrapyd以运行您的蜘蛛
使用scrapyd-client
现在，使用您的网站列表，只需为您的scrapyd进程发出一个curl命令。

我已经使用上述策略来削减200万个域名，我在不到5天的时间内完成了这项工作。