我正在从多个网址抓取数据,这样:
{{1}}
问题是,在这种情况下我有一个大约200行的csv,而对于每个url我有大约50行。在时间刮一个网址工作正常,但如果我设置了多个网址,为什么我会有不同的结果呢?
答案 0 :(得分:1)
我会尝试通过增加请求之间的延迟(DOWNLOAD_DELAY
setting)和减少并发请求量(CONCURRENT_REQUESTS
setting)来调整爬行速度并稍微减慢速度,例如:
DOWNLOAD_DELAY = 1
CONCURRENT_REQUESTS = 4