在Tesseract Ocr中,使用不同类型的字体进行培训会导致识别率下降,如何解决它

时间:2018-11-20 04:06:04

标签: tesseract

如果是相同类型的数字字体(例如黑体),仅训练这种类型的字体识别率就很高,如果我放其他类型的字体(例如细长字体,大约有10种),会导致识别率下降。如何在不降低识别率的情况下将不同类型的字体组合在一起进行训练?

一种方法是分别训练不同类型的字体,最后使用+号连接以识别文件(例如eng + num + num2 + num3),但这会导致识别速度下降。

还有其他解决方法吗?我只想训练一个文件而不使用太多的训练文件。

0 个答案:

没有答案