如何用一只蜘蛛刮擦多个网站(100,000个)?

时间:2019-07-24 06:20:26

标签: python web-scraping scrapy

我想创建一个抓取应用程序来抓取多个网站。请引导我

2 个答案:

答案 0 :(得分:0)

您最好的选择是asyncioaiohttp。以下是一些您可能会觉得有用的资源:

让我还请注意,当您陷入某个已设置的问题中时,应该将StackOverflow用作资源,而不是问那些易于Google处理的问题。

答案 1 :(得分:0)

通过一些网站创建基础Spider来开始工作的最佳方法。然后尝试通过向多个网站添加兼容性来概括代码。

创建适当的项目结构以在python中使用DRY原理。