Java OCR:阅读草书手写

时间:2012-07-08 05:37:10

标签: java ocr

我正在尝试开发和算法来阅读草书手写(准确地说是医生的手写)。我不需要匹配每一个字母,只需要识别可识别的字母(我正在使用字典方法)。

目前,我在BufferedImage课程中有二进制化图像。我接下来要做的就是隔离每个角色。

你能告诉我一个关于如何实现这个目标的伪代码吗?我想尽量少用其他库。我想通过学习如何实现每个过程来做到这一点。任何提示?

2 个答案:

答案 0 :(得分:2)

您需要了解Image Moments等可用于比较图像的内容,即使它们已被旋转或缩放

你需要大量的数学背景来理解如何做到这一点,你可以从阅读这个http://www.ias.ac.in/sadhana/Pdf2007Oct/521开始,它是关于如何实现特定类型角色(卡纳达语)的OCR,相同的一般原则应该适用于你想要做的事情

除非您愿意花费几个月(或几年)时间,否则我建议您使用已有的内容,例如ocropusjavaocr

答案 1 :(得分:1)

或者,您可以从Vision Objects购买HWR SDK,这将大大减少您的开发工作量。