我知道我们采用的是一个16x16的窗口,其间为"中间为"关键点周围的像素。我们将该窗口分成16个4x4窗口。从每个4x4窗口,我们生成8个箱的直方图。每个箱对应于0-44度,45-89度等。来自4x4的梯度方向被放入这些箱中。这适用于所有4x4块。最后,我们将您获得的128个值标准化。 他们获得价值的地方
但我误解了128号码从哪里获得价值?它是指方向值的相应大小还是什么?
如果有人描述任何数字示例问候,我将不胜感激!
答案 0 :(得分:2)
在SIFT(尺度不变特征变换)中,128维特征向量由每个窗口的 4x4样本组成,每个样本8个方向 - 4x4x8 = 128。
对于插图指南,请参阅A Short introduction to descriptors,特别是此图像,显示嵌入每个4x4网格方块(中心图像)中的8向测量(基数和基数),然后是方向直方图(右图):
从你的问题我相信你也不清楚描述符中的信息是什么 - 它被称为定向梯度直方图(HOG)。为了进一步阅读,维基百科概述了HOG gradient computation:
单元格内的每个像素根据渐变计算中找到的值对基于方向的直方图通道进行加权投票。
所有内容都建立在每像素“投票”的基础上。