ocr - 使用斯坦福分类器进行字符识别

使用斯坦福分类器进行字符识别

时间：2015-10-12 20:12:10

标签： ocr stanford-nlp maxent

我正在研究与OCR相关的Android应用程序，我需要使用多元逻辑回归来进行字母表分类。我的问题是，我可以使用斯坦福分类器（http://nlp.stanford.edu/software/classifier.shtml）进行字符识别吗？如果它可以训练图像的数据集？如果我不能那么请为我建议一个JAVA库。

1 个答案:

答案 0 :(得分：1)

伟大的思想相似。我想知道同样的事情。专门针对OCR。即使你提出问题差不多一年了。

听起来很简单;您需要做的就是将每个字符规范化为5x7数组（或者64x128），然后分类为26个上部和26个小写字符;加上键盘上的10位数和31个标点符号...似乎可行。也许当我得到一个圆领... ...

事实证明，有一个用于OCR https://sourceforge.net/projects/javaocr/的Java库，它被称为Java OCR（surprise！:-)）。唯一的问题是：它没有开箱即用。它需要训练。 2.文件不是很好。人们在上班时遇到了麻烦。

祝你好运。