在Linux上使用OCRopus / Tesseract进行Fraktur识别

时间:2009-12-08 15:17:30

标签: ocr tesseract

我正在尝试使用带有ocropus的fraktur字体识别德语文本,但它似乎没有使用deu-f包。

以下是我执行的步骤。

  1. 编译并安装了tesseract和ocropus。
  2. 已下载http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz,请将其解压缩至tessdata /.
  3. 但是当我打电话的时候

     $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

    结果与我打电话时的结果相同

    $ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

    任何想法是什么问题?

1 个答案:

答案 0 :(得分:1)

问题在http://code.google.com/p/ocropus/issues/detail?id=87中描述。只需要将补丁应用于ocropus并重建它。