将tesseract命令行调整为OCR价格

时间:2015-03-20 23:08:32

标签: windows ocr tesseract

我的小图片价格如下:

Image $127.05

但是当我尝试命令时,我得到一个空的输出文件:

tesseract image.png output.txt

我是否应该使用任何特殊命令来对像这样的小图像进行OCR?另外,我可以指定可能的结果只是一个美元符号,一个句号,以及数字0-9吗?

我通过添加配置文件尝试了“字母”方法,但是我没有找到有关美元符号或句点是否需要转义的任何数据。在任何情况下,我都会使用上面命令的简单版本获得零响应。

1 个答案:

答案 0 :(得分:2)

您使用的是什么版本的tesseract?使用以下命令:

tesseract image.png输出-psm 8

我得到了这个结果。

$ 12705

请注意,缺少点。您也可以通过使用扩张算法预处理图像来获得点。

版本信息: tesseract 3.03.00(Windows 7)  leptonica-1。70(2014年8月5日,21:29:11)[MSC v.1800 DLL Release x86]   libgif 4.1.6(?):libjpeg 8c:libpng 1.4.3:libtiff 3.9.4:zlib 1.2.8