我在第二步中遇到一个问题,即在空间单元格上累积加权投票以获得渐变方向。
假设单元格为8*8
。让我使用两个矩阵GO[8][8]([1 9])
,GM[8][8]
分别表示梯度方向和梯度大小。
渐变方向的范围为0 - 180
,并且有9
方位区。
根据我对HOG的理解,对于单元格中的每个像素,将其渐变幅度添加到其对应的方向区域。通过这种方式,我们可以得到每个细胞的直方图。
但有一句让我感到困惑。
“为了减少混叠,插入投票(梯度幅度) 在两个方向上相邻的箱子中心之间的三角形 和位置。“ 1
为什么插值?如何插值?有人能解释得更详细吗?没有减少混叠。
提前致谢。
1 这句话在Navneet Dalal的博士论文p38第4行中。
答案 0 :(得分:8)
插值是计算直方图的标准技术。这里的想法是,每个值不是简单地放在一个箱子中,而是分布在两个相邻的箱子之间(假设是1d直方图),基于它离原箱的中心有多远。
这样做的目的是处理测量中的小错误可能导致将值放入不同的bin中的情况。对于任何类型的直方图,这是一件非常好的事情,不仅仅是针对HOG,假设你有CPU周期。
对于2D和3d直方图,还有双线性和三线性插值,其中每个值分别在4到8个相邻的区间分布。