我应该在Android中使用哪种OCR Java库?

时间:2009-06-30 09:02:29

标签: java android ocr

我想构建一个Android应用程序,通过OCR库,它应该扫描从中提取文本的图片。

我应该使用什么Java库?

4 个答案:

答案 0 :(得分:20)

不知道它有多好(它肯定需要先训练),但有Ron Cemer's Java OCR library

答案 1 :(得分:7)

如果您正在寻找一个非常易于扩展的选项或者有一个特定的问题域,您可以考虑使用Java Object Oriented Neural Engine滚动自己。

我在个人项目中成功使用它来识别来自this等图像的字母,您可以在github here找到我的应用程序的OCR组件的所有来源。

答案 2 :(得分:6)

尝试tesseract, 结帐这篇文章 http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html 这个例子 http://code.google.com/p/mezzofanti/

编辑: 更多事实 - tesseract是谷歌使用的最好的开源OCR之一 - 有许多语言的培训数据 - mezzofanti是一个使用tesseract的Android应用程序 - 注意:OCR确实使用了大量的CPU电源。尝试用你的T-Mob G1 OCR A4页面会花费很多时间,结果可能不会给你留下深刻印象; - )

答案 3 :(得分:0)

您可以使用Google文档中的OCR功能。 查看文档列表数据API http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR