标签: ios ocr tesseract training-data
我需要训练tesseract只识别十个单词 单词是制药名称,类似于:Atrasil,Spectful 由于使用的字体很常见,我试图解压缩eng.traineddata,用这些单词代替freq-dawg和word-dawg。然后我将它们重新装入一个新的训练数据中,不幸的是它似乎并不能很好地工作。匹配结果仍然是不可接受的,即使我使用从简单的word文件中获取的图像,我也无法使用它们。 有没有办法实现良好的匹配?我是否需要从解压缩训练数据中删除其他文件?