我使用Tesseract并用完整的单词作为角色训练它,中国OCR如何做。但这会让我无法制作自己的字体,这是一个耗时且缓慢的过程。这种方法适用于某些场景,但我想根据阿拉伯字符训练tesseract。
或者建议我可以帮助我开发自己的阿拉伯语ocr,无论是否有Tesseract。
我已经研究过OpenCV,但它并没有顺利进行。
我会高度评价你的快速反应。
答案 0 :(得分:1)
Tesseract有许多语言的预训练文件,here是阿拉伯语。
答案 1 :(得分:0)
这是一个非常老的问题,但是对于正在寻找相同内容的人来说,现在tesseract 4附带了经过预训练的阿拉伯语数据以及许多其他语言,here
这是基于tesseract 4的Arabic OCR演示,您可以看到它现在变得多么精确。