如何使用Tesseract ORC检测简单文本?

时间:2016-01-07 09:50:07

标签: tesseract linuxmint leptonica

我尝试使用https://github.com/tesseract-ocr/tesseract将带有数字的简单图像转换为文本。我使用Leptonica编译了github的最新版本以及图像处理所需的其他库。

我的图片如下所示: enter image description here

我试图像这样转换它:/usr/local/bin/tesseract '/home/var/img2text/phone.png' out但不是像3m mam这样的数字。可能是什么问题呢?

1 个答案:

答案 0 :(得分:0)

图像很小,质量有点低,请尝试以下方法:

1-将其DPI更改为300

2-调整图像大小2倍并应用重采样插值。

3-确保它是黑白图像。

以下是一些有用的链接:

https://code.google.com/p/tesseract-ocr/wiki/ImproveQuality

image processing to improve tesseract OCR accuracy