是否可以使用像谷歌趋势的爬虫等代理旋转器?

时间:2016-09-16 17:06:13

标签: python proxy web-crawler google-trends

由于谷歌趋势要求您登录,我仍然可以使用爬虫等IP转子来下载csv文件吗?如果是这样,是否有任何示例代码与python(即python + crawlera下载谷歌上的文件)。

提前致谢。

3 个答案:

答案 0 :(得分:0)

没有人会为你编写代码。

但我可以留下一些评论,因为我过去几个月一直在使用Crawlera代理。

使用crawlera,您可以每次使用新IP刮取Google趋势,甚至每次都可以使用相同的IP(在crawlera中称为会话管理)。

您可以发送标题'X-Crawlera-Session':'create'以及您的请求,Crawlera会在其结束时创建会话,作为回应,他们将返回'X-Crawlera-Session': ['123123123'] ...如果您认为自己不是被Google封锁,

您可以针对每个请求发送'X-Crawlera-Session': '123123123',以便Crawlera每次都使用相同的IP。

答案 1 :(得分:0)

文档中有许多语言的代码示例。 有关Python示例,请参阅https://doc.scrapinghub.com/crawlera.html#python

答案 2 :(得分:0)

是的,可以使用Crawlera以及https://gimmeproxy.com等其他代理api。它提供了可能适合您的Google代理。