Tesseract无法正确识别我的图像

时间:2015-10-28 16:35:34

标签: captcha tesseract

我正在开发一款Android应用,它需要识别网站上的验证码。

我利用 tess-two 来识别验证码并按照 TrainingTesseract3 说明训练我自己训练的数据(使用 jTessBoxEditor 来纠正字符),但它无法正确识别,甚至无法识别它。

以下TIFF图像用于训练我的Tesseract,我收集了许多验证码并将它们合并为图像。

TIFF image

The image that I want to recognize

例如,上面图像的预期结果应该是k8666,但实际结果只有66。

有人给我一个帮助吗?感谢。

1 个答案:

答案 0 :(得分:0)

我使用.NET包装器为tesseract-ocr Tesseract-ocr .Net Wrapper by Charliesw尝试了你的图像。

我得到了更好的结果,如(K8EEE,K8656),我认为你必须增加文本字体并使其变为粗体,我以tDP格式保存图像,96DPI分辨率,以获得比我更好的结果。