纠正MNIST数据集

时间:2013-02-14 17:35:02

标签: ocr skew mnist

我目前正在研究数字手写识别问题。我发现许多状态算法对mnist日期集采用了一些预处理方法,例如偏移和抖动(我不知道'抖动'是什么)。我google了很长时间,但没有发现任何可用于去除mnist日期集的特定方法或算法。有没有人有关于如何解决这个问题的想法?非常感谢!

2 个答案:

答案 0 :(得分:5)

我用Google搜索了很长时间而且很难找到这个,但直到我看到这篇论文才开始:

  

Teow,Loo-Nin和Kia-Fock Loe。 “基于视觉的强大功能和   离线手写数字识别的分类方案。“   模式识别35.11(2002):2355-2364。

阅读第4.2节。他们描述了去除他们的图像的程序。我不确定这是否与 deskewing 相同,但它是我能找到的最接近的东西。

希望有这样的帮助,如果有人能够确认 deslanting 是否与歪斜相同,我们将不胜感激。

答案 1 :(得分:0)

纠正偏离LeCun的1998年论文[http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf]

  

偏斜校正计算像素的第二惯性矩   (将前景像素计为一,将背景像素计为零)   并通过水平移动线条剪切图像   主轴是垂直的。