我正在寻找一个OCR库或任何我可以用来从图像中读取阿拉伯字母的样本。我用Google搜索了很多内容并没有找到任何东西。请帮忙 提前谢谢。
答案 0 :(得分:7)
TesseractOCR可能是最好的开源OCR引擎,并且它可以识别的内容非常灵活。它允许使用自定义数据进行培训,因此只要您愿意投入工作(即创建训练集),基本上任何语言都是可能的。
有tools provided by tesseract(带有gui接口)可以帮助创建数据集,您可以在其中指定字符的边界框和相应的转录。
编辑:从其他帖子(上面已链接)注意到已经为3.01版创建了阿拉伯语培训集。您只需插入阿拉伯数据即可解决问题:)。
答案 1 :(得分:1)
您可以尝试Abbyy Fine Reader,他们可能会使用您正在寻找的语言。