从COMlex验证码中提取文本

时间:2014-03-11 06:20:24

标签: python captcha decode tesseract noise

我需要解码这种Captcha。 http://www0.xup.in/exec/ximg.php?fid=13934152

使用ImageFilter进行一些修改后,ImageEnhance看起来像这样。

http://www0.xup.in/exec/ximg.php?fid=32704628

但这还远未被Tesseract认可。

问题是验证码不是静态的,因此所有的噪音和东西都会改变。

我想知道是否有更复杂的方法从中提取白色文本。更通用的东西。

1 个答案:

答案 0 :(得分:0)

您可以绕过它,而不是试图打破验证码。 mitmproxy可以过滤和修改请求,因此您最终无法接收需要填写验证码的页面。