Scrapy和HTTPS问题

时间:2015-04-21 00:36:47

标签: python web-scraping scrapy

我们通过100个代理池运行Scrapy 0.24.4,并且无法抓取HTTPS链接。我们经常收到以下异常:“无法打开CONNECT隧道”。我知道当Scrapy无法与我们的代理协商HTTP CONNECT隧道时会发生这种情况,但我不知道为什么。

我可以使用.NET堆栈通过相同的代理池成功抓取完全相同的URL,而不是使用Scrapy。环境是Ubuntu 14.04。

0 个答案:

没有答案