应用错误收集

用于培训Tesseract OCR新语言的数据类型

时间：2013-08-22 11:07:57

标签： ocr tesseract training-data

我想知道我们将使用哪种数据来训练Tesseract OCR的新语言？

是每个角色吗？或者我们必须做一些特定的句子？

请帮助提供这些信息的一些来源，我无法在其维基页面上清楚地看到。

1 个答案:

答案 0 :(得分：1)

试试这个页面。它告诉你他们采取的步骤，以使它识别古希腊 http://www.eutypon.gr/eutypon/pdf/e2012-29/e29-a01.pdf

这是tesseract团队关于培训tesseract https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

的一般信息