I am using the vl_phow function (http://www.vlfeat.org/matlab/vl_phow.html) and wondering why the smoothing is applied before the feature extraction.
To be more specific in the documentation of vl_phow it is mentioned that:
The image is smoothed by a Gaussian kernel of standard deviation SIZE / MAGNIF. Note that, in the standard SIFT descriptor, the magnification value is 3; here the default one is 6 as it seems to perform better in applications.
So why is this smoothing operation is done?
Also in the same documentation there is WindowSize option which is explained as follows: size of the Gaussian window in units of spatial bins. Is this Window used to smooth the image or for something else?
Can you please tell me why it is done and the advantages of smoothing the image before the feature extraction.
答案 0 :(得分:4)
虽然这不仅仅是一个数学问题,而是一个MATLAB问题,但无论如何我都会去做。
SIFT功能应该是"脱颖而出"在图像中。它们是具有高信息含量的特征,并且将是不变的"在不同的图像。
然而,嘈杂的图像可能会产生噪音"这看起来很重要。基本示例:
[0 0 0 0 0
0 0 0 2 2
0 1 0 2 2
0 0 0 0 0]
如果没有平滑,人们可能会认为有2个区域有大量信息,区域有2s,区域有1个。但是,2s区域似乎是信息的一部分,因为有很多它们在一起,单个1的部分可能只是噪声,由于成像技术中的噪声,在那里添加了一个小的随机值。
如果使用滤镜对图像进行平滑处理,您会得到类似的内容(例如)
[0 0 0 0 0
0 0 0 1.9 2
0 0.01 0 1.9 2
0 0 0 0 0]
更明显的是,1只是噪音,但2s仍然存在。
那就是为什么特征提取算法(如SIFT)在获取关键点之前通常会使图像平滑。
平滑窗口越大,您找到的关键点就越强大,因为小的东西将被移除。但是,您也会发现较少的关键点。同样使它太大你可能会删除真实信息(例如2s int)。
答案 1 :(得分:0)
去除图像中的噪点。特征(传统上强度的角点)会受到噪音的影响。
答案 2 :(得分:0)
没有相机没有噪音。除非你有一个人造图像,否则你的图像中总会有噪音。
这种噪音有很多来源,随着时间的推移,温度甚至位置的变化。
您会发现将高斯模糊等低通滤波器应用于输入图像或平均多次拍摄是几乎任何图像处理操作的第一步。
如果没有它,几乎不可能从同一个未改变的场景中获得两个图像的相同结果。
要快速了解噪声源和去噪方法,请阅读: http://www.ijaiem.org/volume2issue11/IJAIEM-2013-11-24-070.pdf