应用错误收集

我需要训练tesseract只识别十个单词单词是制药名称，类似于：Atrasil，Spectful
由于使用的字体很常见，我试图解压缩eng.traineddata，用这些单词代替freq-dawg和word-dawg。然后我将它们重新装入一个新的训练数据中，不幸的是它似乎并不能很好地工作。匹配结果仍然是不可接受的，即使我使用从简单的word文件中获取的图像，我也无法使用它们。
有没有办法实现良好的匹配？我是否需要从解压缩训练数据中删除其他文件？

Tesseract培训：只有几个字

0 个答案: