我目前正在研究数字手写识别问题。我发现许多状态算法对mnist日期集采用了一些预处理方法,例如偏移和抖动(我不知道'抖动'是什么)。我google了很长时间,但没有发现任何可用于去除mnist日期集的特定方法或算法。有没有人有关于如何解决这个问题的想法?非常感谢!
答案 0 :(得分:5)
我用Google搜索了很长时间而且很难找到这个,但直到我看到这篇论文才开始:
Teow,Loo-Nin和Kia-Fock Loe。 “基于视觉的强大功能和 离线手写数字识别的分类方案。“ 模式识别35.11(2002):2355-2364。
阅读第4.2节。他们描述了去除他们的图像的程序。我不确定这是否与 deskewing 相同,但它是我能找到的最接近的东西。
希望有这样的帮助,如果有人能够确认 deslanting 是否与歪斜相同,我们将不胜感激。
答案 1 :(得分:0)
纠正偏离LeCun的1998年论文[http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf]。
偏斜校正计算像素的第二惯性矩 (将前景像素计为一,将背景像素计为零) 并通过水平移动线条剪切图像 主轴是垂直的。