这主要是好奇心,但纯Java中是否有任何OCR实现?我很好奇这将如何纯粹用Java表现,而OCR一般对我感兴趣,所以我很想看看它是如何用我完全理解的语言实现的。当然,这需要实现是开源的,但我仍然对专有解决方案感兴趣,因为我至少可以检查这种情况下的性能。
我见过一对可以在Java中使用的东西(比如Asprise),但似乎这些都不是纯Java实现......有没有?
答案 0 :(得分:81)
我建议在sourceforge.net上尝试Java OCR项目。我最初开发它,我有a blog posting on it。
自从我把它放在sourceforge之后,通过志愿者研究人员/开发人员的出色工作,它的功能得到了扩展和改进。
尝试一下,如果你不喜欢它,你可以随时改进它!
答案 1 :(得分:9)
如果您正在寻找一个非常可扩展的选项或有一个特定的问题域,您可以考虑使用Java Object Oriented Neural Engine滚动自己。另一个JOONE参考。
我在个人项目中成功使用它来识别来自this等图像的字母,您可以在github here找到我的应用程序的OCR组件的所有来源。
答案 2 :(得分:9)
我们已经测试了一些使用Java的OCR引擎,如Tesseract,Asprise,Abbyy等。在我们的分析中,Abbyy给出了最好的结果。
答案 3 :(得分:5)
那里有各种各样的OCR库。但是,我的经验是,主要的商业实现,ABBYY,Omnipage和ReadIris远远超过开源或其他次要实现。这些商业库主要不是为了与Java一起使用而设计的,当然它是可能的。
当然,如果您有兴趣学习代码,那么开源实现就可以解决问题。
答案 4 :(得分:3)
刚刚找到这个(不知道,未经过测试,检查自己)
由于你只需要这个好奇心,你可以查看这个小程序的来源。
它使用神经网络进行手写字符的OCR