用于培训Tesseract OCR新语言的数据类型

时间:2013-08-22 11:07:57

标签: ocr tesseract training-data

我想知道我们将使用哪种数据来训练Tesseract OCR的新语言?

是每个角色吗?或者我们必须做一些特定的句子?

请帮助提供这些信息的一些来源,我无法在其维基页面上清楚地看到。

1 个答案:

答案 0 :(得分:1)

试试这个页面。它告诉你他们采取的步骤,以使它识别古希腊 http://www.eutypon.gr/eutypon/pdf/e2012-29/e29-a01.pdf

这是tesseract团队关于培训tesseract https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

的一般信息