为具有打印和手写数据的图像训练tesseract

时间:2016-03-10 04:31:35

标签: tesseract training-data

我对tesseract培训非常困惑

我使用了带有英语语言的tesseract,结果是80%准确,我正在努力提高准确性。我想到用原始图像创建一种新语言作为训练数据。如果我使用原始数据作为列车数据,结果会改善吗?我训练了它,但与原版相比,结果非常糟糕。

那么有什么方法可以修改原始的训练有素的人,以便我可以提高准确性?我尝试按照文档进行操作,比如更改uncharambigs但是没用。

另一个问题是我的图像有打印数据(多数)和手写数据。那么,我应该如何训练tesseract,我应该先打印数据然后再写入手写数据还是单独进行?

0 个答案:

没有答案