我目前正在使用Tesseract-OCR来识别图片中的一些文字。但现在我有一个问题。因为有些词语无法识别。我特意训练了它们但它仍然没有用!
在训练像DAWG文件等语言数据时,我是否需要一些额外的文件? 对此一无所知。因为有时它会在某些特殊位置和方向显示时识别其中的一些。
真的很混乱。真诚地需要你的帮助。提前谢谢!
其他信息:
我使用的是简体中文。(我不知道在使用中文时是否有任何我没有设置的参数)
由于我想识别的图片是一张桌子。它有几行。在识别表格以提高准确性时,您对这种情况有任何想法。
因为我不知道它是否是由单词的特殊形状引起的。我在这里直接粘贴一些单词。上下午一二三四五
非常感谢!