双语图像(含文字)检测

时间:2016-03-10 06:32:05

标签: java opencv tesseract

我有几个图像包含我想要执行OCR的文本,但问题是一些图像是双语的,包含英语和阿拉伯语文本,有些是纯英语。我该如何检测这些双语页面?我只想要英语OCR。

1 个答案:

答案 0 :(得分:0)

我在前一段时间对一个工作项目进行了相当广泛的OCR研究并遇到Tesseract。至少在当时,这似乎是最好的OCR技术。我遇到了另一篇帖子,有人说它有一个API。根据上面链接中的wiki文章,这提供了多语言支持。 Here's a Java library.