通过Tesseract-OCR无法识别某些单词(受过训练)

时间:2013-11-27 03:11:13

标签: c++ ocr tesseract image-recognition training-data

我目前正在使用Tesseract-OCR来识别图片中的一些文字。但现在我有一个问题。因为有些词语无法识别。我特意训练了它们但它仍然没有用!

在训练像DAWG文件等语言数据时,我是否需要一些额外的文件? 对此一无所知。因为有时它会在某些特殊位置和方向显示时识别其中的一些。

真的很混乱。真诚地需要你的帮助。提前谢谢!

其他信息:

  1. 我使用的是简体中文。(我不知道在使用中文时是否有任何我没有设置的参数)

  2. 由于我想识别的图片是一张桌子。它有几行。在识别表格以提高准确性时,您对这种情况有任何想法。

  3. 因为我不知道它是否是由单词的特殊形状引起的。我在这里直接粘贴一些单词。上下午一二三四五

  4. 非常感谢!

0 个答案:

没有答案