作为脱机手写识别程序的一部分,我有大量的手写数字,由大约0到9的数字人员编写。在让程序对每个图像进行分类之前,我想做一点预处理以更标准的形式获得它们。
所有图像目前都是由1s和0s组成的64x64网格(0表示白色,1表示黑色),但由于手写样式的差异,有些数字比其他数字大,有些数字定位不同,有些数字有所不同奇怪的斜面(就像人们画出的斜线一样)
我已经大致弄清楚如何将它们全部移动到同一个中心并使它们大致相同,我知道要纠正倾斜/倾斜,我需要将它们旋转一定量。问题是:我怎么知道旋转图像的数量是多少?是否有一些标准算法,我可以指出我的资源来解决它?
答案 0 :(得分:0)
我会考虑在每个图像的像素上应用principal component analysis算法,这应该为您提供线条的两个主要方向。然后,您可以根据相应的坐标系进行旋转。