我正在通过this教程向tesseract添加新字体,到目前为止,我已经为我的pdf创建了tiff文件。我正在尝试运行命令:
tesseract eng.impact.exp0.tiff eng.impact.exp0 batch.nochop makebox
但它只是显示了这个:
与Leptonica一起使用Tesseract开源OCR Engine v3.02
无法打开输入文件:eng.impact.exp0.tiff
我只是想不通为什么!
我运行以下命令来创建tiff文件:
convert -density 300 -depth 4 eng.impact.exp0.pdf eng.impact.exp0.tif
编辑:嗯,将-depth选项更改为8而不是4。 ._。
答案 0 :(得分:2)
您的图片文件名中似乎有拼写错误。它应该是:
tesseract eng.impact.exp0.tif eng.impact.exp0 batch.nochop makebox
答案 1 :(得分:0)
尝试使用此命令重命名您的TIFF文件:
mv eng.impact.exp0.tif eng.impact.exp0.tiff
然后才运行tesseract:
tesseract eng.impact.exp0.tiff eng.impact.exp0 batch.nochop makebox
答案 2 :(得分:-1)
我有这个问题并解决了。
您必须首先复制tesseract.exe旁边的图像文件,然后转到该目录并打开命令提示符并运行命令。就是这个。
注意:在命令提示符下,您必须位于tesseract的路径中,并且图像文件必须位于此路径中。