硒

Selenium使浏览器自动化。现在，使用这种功能实现的功能完全取决于个人，但主要是为了通过浏览器客户端自动化Web应用程序以进行测试，并且粗略地讲，它当然不限于此。

验证码

另一方面，Captcha（缩写为 ...完全自动化的公共Turing测试，以告诉计算机和人类分开... ）是一种挑战－响应测试用于计算以确定用户是否为人类。

因此， Selenium 和 Captcha 具有两个完全不同的目的，理想情况下不应用于完成任何相互关联的任务。

话虽如此，recaptcha可以轻松检测网络流量并将您的程序标识为 Selenium 驱动的 BOT 。

通用解决方案

但是，有一些通用方法可以避免在抓取网页时被检测到

网站可以通过您的监视器大小来确定您的脚本/程序的首要属性。因此，建议不使用常规的Viewport。
如果您需要向网站发送多个请求，请继续对每个请求更改用户代理。在这里您可以找到有关Way to change Google Chrome user agent in Selenium?
要模拟类似人的行为，您可能需要减慢脚本执行的速度，甚至超出WebDriverWait和expected_conditions引起time.sleep(secs)的程度。在这里您可以找到有关How to sleep webdriver in python for milliseconds

此用例

但是，在几个用例中，我们可以使用 Selenium 与reCAPTCHA进行交互，您可以在以下讨论中找到更多详细信息：

参考

您可以在以下位置找到一些相关的讨论

tl;博士

How does recaptcha 3 know I'm using selenium/chromedriver?

Answer 2

为了在抓取Google时绕过验证码，您必须手动解决验证码并导出Google给您的Cookie。现在，每次打开Selenium Webdriver时，请确保添加导出的cookie。 GOOGLE_ABUSE_EXEMPTION cookie是您要寻找的cookie，但是为了安全起见，我会保存所有cookie。

如果您想在剪贴簿中增加一层稳定性，则应该导出多个Cookie，并在每次ping Google时让脚本随机选择其中一个。

这些cookie的有效期很长，因此您不必每天都获取新的cookie。

要获取有关在Python和Selenium中保存和加载Cookie的帮助，您应该查看以下答案：https://stackoverflow.com/a/15058521/1499769

希望这会有所帮助！

Answer 3

清除浏览历史、缓存数据、cookies 和其他站点数据首先在 selenium 打开的浏览器窗口中创建一个 Google 帐户。登录您的帐户

wd.get("https://accounts.google.com/signin/v2/identifier?hl=en&passive=true&continue=https%3A%2F%2Fwww.google.com%2F%3Fgws_rd%3Dssl&ec=GAZAmgQ&flowName=GlifWebSignIn&flowEntry=ServiceLogin");
    Thread.sleep(2000);
    wd.findElement(By.name("identifier")).sendKeys("Email"+Keys.ENTER);
    Thread.sleep(3000);
    wd.findElement(By.name("password")).sendKeys("Password"+Keys.ENTER);
    Thread.sleep(5000);

然后打开任何使用此代码在复选标记上打勾的网站

String framename=wd.findElement(By.tagName("iframe")).getAttribute("name");
            wd.switchTo().frame(framename);
    wd.findElement(By.xpath("//span[@id='recaptcha-anchor']")).click();

你不会找到任何拼图或任何东西。

Answer 4

简单的解决方案是暂停程序 10 秒或更长时间，然后在自动浏览器打开时自行解决 reCAPTCHA，然后程序在 10 秒后启动并执行程序的其余部分，例如点击提交按钮或其他东西

如何使用Selenium和python绕过Google验证码？

4 个答案:

硒

验证码

通用解决方案

此用例

参考

tl;博士