使用斯坦福分类器进行字符识别

时间:2015-10-12 20:12:10

标签: ocr stanford-nlp maxent

我正在研究与OCR相关的Android应用程序,我需要使用多元逻辑回归来进行字母表分类。我的问题是,我可以使用斯坦福分类器(http://nlp.stanford.edu/software/classifier.shtml)进行字符识别吗?如果它可以训练图像的数据集?如果我不能那么请为我建议一个JAVA库。

1 个答案:

答案 0 :(得分:1)

伟大的思想相似。我想知道同样的事情。专门针对OCR。 即使你提出问题差不多一年了。

听起来很简单;您需要做的就是将每个字符规范化为5x7数组(或者64x128),然后分类为26个上部和26个小写字符;加上键盘上的10位数和31个标点符号...似乎可行。也许当我得到一个圆领... ...

事实证明,有一个用于OCR https://sourceforge.net/projects/javaocr/的Java库,它被称为Java OCR(surprise!:-))。唯一的问题是: 它没有开箱即用。它需要训练。 2.文件不是很好。 人们在上班时遇到了麻烦。

祝你好运。