应用错误收集

通过Tesseract-OCR无法识别某些单词（受过训练）

时间：2013-11-27 03:11:13

标签： c++ ocr tesseract image-recognition training-data

我目前正在使用Tesseract-OCR来识别图片中的一些文字。但现在我有一个问题。因为有些词语无法识别。我特意训练了它们但它仍然没有用！

在训练像DAWG文件等语言数据时，我是否需要一些额外的文件？对此一无所知。因为有时它会在某些特殊位置和方向显示时识别其中的一些。

真的很混乱。真诚地需要你的帮助。提前谢谢！

其他信息：

我使用的是简体中文。（我不知道在使用中文时是否有任何我没有设置的参数）
由于我想识别的图片是一张桌子。它有几行。在识别表格以提高准确性时，您对这种情况有任何想法。
因为我不知道它是否是由单词的特殊形状引起的。我在这里直接粘贴一些单词。上下午一二三四五

非常感谢！

0 个答案:

没有答案