我正在寻找一个OCR库 - 最好是开源 - 我可以在一些阿拉伯语pdf上使用。谷歌搜索没有产生任何有用的东西。我想知道是否有人知道相关的OCR库,甚至是相关语言(波斯语和乌尔都语可能相关),可以添加阿拉伯语支持。
有关如何处理此问题的任何一般性建议将不胜感激。
答案 0 :(得分:9)
从Tessaract-ocr版本3.01开始,它现在支持阿拉伯语
答案 1 :(得分:0)
我对阿拉伯语OCR质量一无所知,但有些智能谷歌搜索发现Sakhr's Automatic Reader。这是商业软件。
对不起。它是商业的,而且相当昂贵。阿拉伯语可能是世界上最难进行OCR的语言之一 - 我想要激励某人做这件事需要很多。
答案 2 :(得分:0)
由于语言的性质,阿拉伯语在OCR方面很复杂,并且没有免费或商业软件可以100%准确。
根据我的个人经验,您可以尝试IRISREadIRIS pro 14。