手写识别与简单的培训

时间:2011-05-26 03:38:12

标签: ocr handwriting

我一直在阅读(并尝试)之前答案中提出的OCR程序,但我仍然没有明确回答我的问题。

我需要识别手写的英文文本。文本将是多行,但每行只有一个或两个单词的长度。该文本来自不同的人。我可以要求那个人提供一个培训档案(例如字母和0-9号码)但我真的不能要求比这更复杂的培训。

我需要将识别作为另一个(Java)应用程序的一部分进行集成,但解决方案不需要是Java。我可以从Java执行它并从文本文件中获取结果。

有什么建议吗?

我已经测试过Tesseract(没有经过培训和培训的结果很糟糕)。 Java OCR看起来像是一个完美的解决方案(简单的培训,开源和Java),但即使有自己的例子也没有用(任何人都有更好的体验?)。 GOCR似乎不太活跃。

当然我更喜欢免费的解决方案,但这不是必须的(虽然我看到的商业选项的问题是我必须能够将它集成到我自己的应用程序中,它将作为SaaS提供)

3 个答案:

答案 0 :(得分:3)

根据我的经验,即使没有经过培训,ABBYY也是手写识别的最佳选择之一。 (它可能也是最贵的之一,但是......)他们有一个SDK for Java。

http://www.abbyy.com

通过免费试用,它绝对值得一看!

答案 1 :(得分:1)

我知道近6年后我才回答。但如果还有人在寻找,请尝试使用tensorflow。他们的网站有一个简单的手写数字识别(MNIST)示例。您可以使用此示例并将其实现为手写字母识别(您需要使用NIST特殊数据库19来获取此数据)。

答案 2 :(得分:0)

我正在寻找一个手写的文本识别软件。到目前为止,唯一一个比abby 11更好的结果是SimpleOCR使用相同的文本,这是一个免费软件的ocr,但为HCR的14天试用!