我想写一个机器人来抓取https://www.bustabit.com/的长期统计数据 但我意识到他们在登录表单上有一个谷歌验证。 现在我想知道它是否有可能绕过这种安全性。
我使用Python与Selenium和PhantomJS
我正在考虑在登录后从我的Chrome浏览器传递PhantomJS Cookie /会话,因此它会在网站访问时自动连接 - 但这是否可能?
感谢您的帮助!
答案 0 :(得分:1)
Google的登录验证旨在阻止机器人进行身份验证。我也不会建议试图暴力破坏这些谜题,它比它的价值更麻烦。
根据您创建新网络会话的频率,您可以直接导航到登录页面,输入凭据然后暂停脚本并提示人来解决验证码,然后再处理控制回硒。
答案 1 :(得分:0)
你可以试试这个:http://scraping.pro/recaptcha-solve-selenium-python/
就我而言,公共场合没有什么可以解决难题。如果有,谷歌会很快修复它。因此,你最好的选择是暴力破坏它。如果仍然有效。