机器学习中照片OCR的算法

时间:2012-08-31 09:15:25

标签: algorithm machine-learning ocr

我最近参加了关于课程的机器学习课程,并通过了相当不错的课程。我在课程中使用了KNN,Logistic回归,NN等算法,其中一项任务就是编写我能够完成的数字识别学习算法。课程以Photo OCR的案例研究结束,这让我非常兴奋,但我发现很难应用课程中教授的基本算法来解决这个大问题。所以有人能建议我使用Photo OCR算法吗?

1 个答案:

答案 0 :(得分:3)

图像识别的问题在于它对任何变化都非常敏感。他们平均人脑能够从图像中提取某些特征,即使已经应用了某些图像操作(如倾斜,旋转等),我们也可以识别给定的图像。

据说,据我所知,人工神经网络是最广泛使用的(投入隐藏层或两层通常也有帮助)。我听说的另一种技术是Wisard(或巫师),但我找不到任何关于它的东西。这种技术基本上将图像分成几个部分,然后在将图像片段与您的知识库中的内容进行比较时获得一定的相似度。

话虽如此,如果我在哪里,我会坚持神经网络加上像OpenCV这样的体面图形处理库(这里有各种包装器,包括Java和C#)。目的是消除尽可能多的不需要的信息。例如,在某些情况下,将图像缩小为灰度或严格的黑白像素会有所帮助。