Scrapy:没有启用主机和持久支持的路由

时间:2014-01-21 23:38:50

标签: python web-crawler scrapy

如果我正在运行启用了持久支持的爬虫,并且我暂时松开了互联网连接。在临时网络丢失期间,爬虫是否会重试无法获得主机错误路由的URL?

1 个答案:

答案 0 :(得分:2)

Scrapy使用HTTP 1.1客户端,默认情况下具有持久支持,并且在引擎盖下(由于Twisted),它使用一个持久连接池,当连接丢失时自动重试。

除此之外,当Scrapy获取请求的连接错误(超时,dns错误,无路由等)时,RetryMiddleware负责重试请求。见http://doc.scrapy.org/en/latest/topics/downloader-middleware.html#module-scrapy.contrib.downloadermiddleware.retry