Question

我无法理解http://www.vlfeat.org/matlab/vl_dsift.html中显示的 vlfeat 中的密集筛选文档。他们提到了一个像素网格宽度的bin size参数，并提到了垂直和水平位移的step参数。

我使用以下代码

测试这些参数

[f, d] = vl_dsift(single(image), 'size', 16 , 'step' , 5 ) ;

我的图像是50X50矩阵。我希望关键帧从（1,1）开始移动到（1,6）#displacement of 5水平等等。

但是我获得的结果在(25,25)点只有1个筛选描述符。

有谁知道这些参数究竟意味着什么，以及我是否正确应用它们？有没有办法在上面提到的模式中应用它（从左上角开始，除了手动获取位置之外，步长的垂直和水平位移）

Answer 1

他们写了

提取的描述符的比例由选项控制 SIZE，即空间bin的像素宽度（回想一下SIFT descriptor是一个空间直方图，有4 x 4个bin。

因此，它计算尺寸为4 * 16 = 64 x 64像素的图像的正方形部分的SIFT。您的整个图像少于计算所需的区域。我想知道，为什么你会得到那个。此外，即使它足够大，也无法计算点（1,1）的SIFT，因为仅定义了补丁的东南部分，其他部分位于图像之外。