我无法理解http://www.vlfeat.org/matlab/vl_dsift.html中显示的 vlfeat 中的密集筛选文档。他们提到了一个像素网格宽度的bin size
参数,并提到了垂直和水平位移的step
参数。
我使用以下代码
测试这些参数[f, d] = vl_dsift(single(image), 'size', 16 , 'step' , 5 ) ;
我的图像是50X50矩阵。我希望关键帧从(1,1)开始移动到(1,6)#displacement of 5水平等等。
但是我获得的结果在(25,25)
点只有1个筛选描述符。
有谁知道这些参数究竟意味着什么,以及我是否正确应用它们?有没有办法在上面提到的模式中应用它(从左上角开始,除了手动获取位置之外,步长的垂直和水平位移)
答案 0 :(得分:1)
他们写了
提取的描述符的比例由选项控制 SIZE,即空间bin的像素宽度(回想一下SIFT descriptor是一个空间直方图,有4 x 4个bin。
因此,它计算尺寸为4 * 16 = 64 x 64像素的图像的正方形部分的SIFT。您的整个图像少于计算所需的区域。我想知道,为什么你会得到那个。 此外,即使它足够大,也无法计算点(1,1)的SIFT,因为仅定义了补丁的东南部分,其他部分位于图像之外。