OCR和神经网络?

时间:2014-02-09 16:24:58

标签: neural-network ocr

我正在尝试为商店门票(使用Java)编写OCR代码,我对图像字典距离有很好的结果,但不适用于偏斜文本或不良扫描。 我听说神经元网络是完美的。

问题:您建议哪种类型的神经元网络进行车票字符检测?

Thks

2 个答案:

答案 0 :(得分:3)

神经网络不会神奇地为您解决问题。他们将遇到与您目前的方法类似的问题。在将其发送到分类器之前,您很可能必须检测偏斜并进行纠正。

与扫描不良相似。这取决于什么是错误的扫描。例如,一些神经网络在校正模糊(未聚焦的图像,移动模糊,......)方面非常有效。

看看有关OCR和神经网络的一些论文。这是一个经典主题所以有很多。例如,The Anatomy of Bangla OCR System for Printed Texts Using Back Propagation Neural Network也试图在运行神经网络之前解决图像偏斜的问题。

我知道循环神经网络可以用于OCR。即使是非常简单的人也很容易识别出简单的字符。最近有一篇论文改进了它们:High-Performance OCR forPrinted English and Fraktur using LSTM Networks。它们甚至包括文本行规范化,这在您的情况下可能非常有用。

请注意,这里有一个关于为OCR训练正常的前馈反向传播神经网络的答案:training feedforward neural network for OCR

答案 1 :(得分:1)

带有“深度学习”的“卷积神经网络”已被证明可以在OCR中提供一些最佳结果(特别是在MNIST数据库上)。

一个很好的起点是this tutorial