Dryscrape(py):'不支持套接字上的操作'

时间:2014-01-27 17:43:29

标签: python web-scraping

由于为Py寻找一个好的刮擦解决方案的麻烦,我正在使用Dryscrape。但是,我似乎无法通过代理持续工作。有些网站会引发以下情况:

  

InvalidResponseError:加载网址时出错   https://apis.google.com/js/plusone.js:套接字上的操作不是   支持(错误代码99)

我想这是某种代理保护的东西,但我没有打破任何TOS或任何东西。只有一些网站这样做,但整个项目都依赖于每天在网站上查找内容。有没有人有解决方案?

1 个答案:

答案 0 :(得分:1)

没有任何代码并且知道你想要完成什么,这真的很难说。但是,如果您尝试同时搜索大量页面,请尝试限制当前与代理连接的#。它是否发生在每次尝试的同一页面上?