如何改善Pytesseract结果

时间:2019-12-16 23:49:24

标签: python linux tesseract captcha python-tesseract

我正在尝试在Raspberry Pi 4上使用Python3解决一些半简单的验证码。这是我当前的代码。

from PIL import Image
from pytesseract import image_to_string

img=Image.open('/home/pi/Desktop/Captcha Code Tests/img.png')
text=image_to_string(img, lang='eng')
print(text)

这是我正在使用的图片之一(我从特定的网站上下载了很多验证码以进行练习)

img.png

打印结果时我得到

TNF 5

太好了!减去空间,但可以轻松移除。我的问题是只能解决每15个代码。这里有一些其他无法解决的字体(我相信它们都是相同的字体,但有些字体比其他字体更弯曲)。

img (1).png

img (2).png

img (3).png

img (4).png

任何帮助都将不胜感激。我已经下载了很多,如果我什至没有选择,也不必建立一个图书馆来帮助它学习,只是不知道怎么做。

谢谢!


编辑1:

因此,在仔细检查CAPTCHA时,似乎所有代码都以相同的方式扭曲。就像他们通过了滤波器一样。第一个和第三个字符始终向右旋转,而第二个和第四个字符始终向左旋转。有没有办法通过过滤器运行它们来扭转这种情况?我希望最终结果是100%自动化的。这张照片显示了我的意思更好。 Warp Correction Picture 再次感谢!

0 个答案:

没有答案