您好我是Computer Vision的新手。我正在研究Dense SIFT和HOG。对于密集SIFT,算法只将每个点视为感兴趣点并计算其梯度向量。 HOG是用渐变矢量描述图像的另一种方式。
我认为Dense SIFT是HOG的特例。在HOG中,如果我们将bin大小设置为8,则每个窗口有4个块,每个块有4个单元格,块步长与块大小相同,我们仍然可以为此窗口获得128个暗淡的向量。我们可以设置任何窗口步幅来滑动窗口以检测整个图像。如果这两个算法的窗口步幅相同,它们可以得到相同的结果。
我不确定我是否正确。任何人都可以帮助我吗?
答案 0 :(得分:7)
SIFT描述符选择16x16然后将其划分为4x4窗口。在这4个窗口中的每个窗口上,它计算直方图的直方图。在计算该直方图时,它还在相邻角度之间执行插值。一旦你拥有了所有4x4窗口,它就会使用一半窗口大小的高斯,以16x16块的中心为中心,对整个16x16描述符中的值进行加权。
另一方面,HoG只计算一个简单的定向梯度直方图,如名称所示。由于所涉及的高斯权重,我认为SIFT更适合描述一个点的重要性,而HoG没有这样的偏差。由于这个原因,(理想情况下)如果所有特征向量连接成一个巨大的向量(这是我的观点,可能不是真的),HoG应该更适合于密集SIFT上的图像分类。