.Net中的阿拉伯语OCR

时间:2015-12-10 06:11:35

标签: opencv ocr tesseract arabic

我使用Tesseract并用完整的单词作为角色训练它,中国OCR如何做。但这会让我无法制作自己的字体,这是一个耗时且缓慢的过程。这种方法适用于某些场景,但我想根据阿拉伯字符训练tesseract。

或者建议我可以帮助我开发自己的阿拉伯语ocr,无论是否有Tesseract。

我已经研究过OpenCV,但它并没有顺利进行。

我会高度评价你的快速反应。

2 个答案:

答案 0 :(得分:1)

Tesseract有许多语言的预训练文件,here是阿拉伯语。

答案 1 :(得分:0)

这是一个非常老的问题,但是对于正在寻找相同内容的人来说,现在tesseract 4附带了经过预训练的阿拉伯语数据以及许多其他语言,here

这是基于tesseract 4的Arabic OCR演示,您可以看到它现在变得多么精确。