如何从复杂的数学验证码中提取数字和数学运算符

时间:2019-11-27 10:03:17

标签: java captcha python-tesseract

我想使用Python自动访问使用此类验证码的网站。我尝试使用pytesseract,但没有任何结果。enter image description here

1 个答案:

答案 0 :(得分:0)

CAPTCHA(“完全自动化的公共图灵测试以区分计算机和人类”)的目的对于机器来说,提取文本或视觉元素非常困难,而“正常”人则不应任何麻烦。

您可以采用多种方法绕过CAPTCHA,但是请记住,CAPTCHA本身的微小变化可能会导致绕过CAPTCHA的额外困难。

您要读取的验证码不能用标准的OCR读取,否则验证码的目的就无法实现。此外,要求对提取的数据进行数学运算。操作本身可以随时更改。

开始时,有几个站点在页面本身或图像地址中托管了其验证码的解决方案。如今,这种情况极为罕见。

据我所知,解决这类验证码最有效的方法是依靠从事此工作的人员网络。我不确定是否可以在SO中在此处发布到这些网络的链接,但是可以通过简单的Google搜索来完成。

通常情况下,网络有一个客户端来提交图像,然后您获取CAPTCHA的文本。根据网络的不同,您可以获得解决问题的信用,而因要求验证码而失去信用。

这可以自动化。请记住,现代的验证码需要用户通过单击和拖放的形式与验证码本身进行交互,因此,在这种情况下,这些网络将无效。