我最近阅读了一些关于神经网络的期刊和pdf。我把我的想法引向了一篇关于“使用神经网络进行手写识别”的文章。另外,我正在研究Backpropagation。我的问题是“为什么作者建议读者使用Sobel算子作为预处理技术,而不是明确地处理神经网络的笔迹?
答案 0 :(得分:1)
手写由笔画组成,通常笔画用纯色填充:通过这些假设,笔画的边缘很好地描述了笔画,而它的颜色或背景色在描述时并没有那么有用。边缘基本上由布尔值描述:当像素是边缘的一部分时,像素是白色,否则是黑色。
Sobel滤波器的输出图像的灰度级与边缘的强度成比例,因此它可用于描述边缘然后描述笔划,或者,“捕获”手写的本质字母和数字。
如果您使用手写字母或数字的原始图像为网络提供信息,则网络可能会学习一些不太有用的功能,例如完整的灰度级别,这些功能无法很好地描述字母或数字。
有些作者声称,即使我认为不完全正确,Sobel滤镜也会以亮度不变的方式给出边缘。
出于好奇,作者建议读者使用Sobel滤波器的论文是什么?