Question

我正在尝试使用带有ocropus的fraktur字体识别德语文本，但它似乎没有使用deu-f包。

以下是我执行的步骤。

编译并安装了tesseract和ocropus。
已下载http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz，请将其解压缩至tessdata /.

但是当我打电话的时候

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

结果与我打电话时的结果相同

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

任何想法是什么问题？

Answer 1

问题在http://code.google.com/p/ocropus/issues/detail?id=87中描述。只需要将补丁应用于ocropus并重建它。