Tesseract OCR如何改善结果?

时间:2017-03-24 01:59:16

标签: ocr tesseract

enter image description here

我很难与Tesseract合作,有没有办法提高准确度?如果需要,我如何为自己训练?

我唯一要做的就是阅读以下字符,XYZ:-0123456789 而已!这些照片总是这样。

谢谢!

1 个答案:

答案 0 :(得分:4)

Tesseract 4.00alpha与您的图像的输出是

$ tesseract ICKcj.png - -l eng
*: 4606 Y; 4809 Z; 698

Warning. Invalid resolution 0 dpi. Using 70 instead.

将图片重新取样至50%并将dpi设置为300:

enter image description here

此图像的输出略胜一筹,警告消失:

$ tesseract ICKcj-50.png - -l eng
X: 4606 Y: 4809 Z: 698

唯一缺少的是减号,它们印刷得非常不规则(图片中更好的分辨率可能有所帮助)。也可以限制tesseract中的输出模式。或者,您可以尝试根据X,Y,Z和数字之间的空格来猜测减号。