应用错误收集

时间：2012-07-08 05:37:10

标签： java ocr

我正在尝试开发和算法来阅读草书手写（准确地说是医生的手写）。我不需要匹配每一个字母，只需要识别可识别的字母（我正在使用字典方法）。

目前，我在BufferedImage课程中有二进制化图像。我接下来要做的就是隔离每个角色。

你能告诉我一个关于如何实现这个目标的伪代码吗？我想尽量少用其他库。我想通过学习如何实现每个过程来做到这一点。任何提示？

答案 0 :(得分：2)

您需要了解Image Moments等可用于比较图像的内容，即使它们已被旋转或缩放

你需要大量的数学背景来理解如何做到这一点，你可以从阅读这个http://www.ias.ac.in/sadhana/Pdf2007Oct/521开始，它是关于如何实现特定类型角色（卡纳达语）的OCR，相同的一般原则应该适用于你想要做的事情

除非您愿意花费几个月（或几年）时间，否则我建议您使用已有的内容，例如ocropus或javaocr

答案 1 :(得分：1)

或者，您可以从Vision Objects购买HWR SDK，这将大大减少您的开发工作量。