我正在开发一款Android应用,它需要识别网站上的验证码。
我利用 tess-two 来识别验证码并按照 TrainingTesseract3 说明训练我自己训练的数据(使用 jTessBoxEditor 来纠正字符),但它无法正确识别,甚至无法识别它。
以下TIFF图像用于训练我的Tesseract,我收集了许多验证码并将它们合并为图像。
The image that I want to recognize
例如,上面图像的预期结果应该是k8666,但实际结果只有66。
有人给我一个帮助吗?感谢。
答案 0 :(得分:0)
我使用.NET包装器为tesseract-ocr Tesseract-ocr .Net Wrapper by Charliesw尝试了你的图像。
我得到了更好的结果,如(K8EEE,K8656),我认为你必须增加文本字体并使其变为粗体,我以tDP格式保存图像,96DPI分辨率,以获得比我更好的结果。