我想知道我们将使用哪种数据来训练Tesseract OCR的新语言?
是每个角色吗?或者我们必须做一些特定的句子?
请帮助提供这些信息的一些来源,我无法在其维基页面上清楚地看到。
答案 0 :(得分:1)
试试这个页面。它告诉你他们采取的步骤,以使它识别古希腊 http://www.eutypon.gr/eutypon/pdf/e2012-29/e29-a01.pdf
这是tesseract团队关于培训tesseract https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
的一般信息