我必须自动化一个涉及大量Google搜索的任务,这是我通过Selenium和python完成的。经过20次搜索,谷歌说检测到可疑活动,并给出reCaptcha
以证明我不是机器人。
我尝试了其他方法(例如更改个人资料),但仍然存在相同的问题。
如何摆脱它?
答案 0 :(得分:0)
网站可以轻松检测您的网络流量,并将其标识为 BOT 。 Google 已经发布了 5(五) reCAPTCHA,供您在创建新网站时选择。其中四个处于活动状态,而 reCAPTCHA v1 正在关闭。
但是,有一些通用方法可以避免在抓取网页时被检测到
time.sleep(secs)
的程度。在这里您可以找到有关How to sleep webdriver in python for milliseconds 请参阅:
答案 1 :(得分:0)
我通过使用内部负载平衡器旋转适当的代理池,切换用户代理并在适当的地方使用验证码解决方案API来解决了这一问题。迄今为止,拥有大量干净的IP地址并明智地使用它们具有最大的影响。