像我之前的其他人一样HOG Trilinear Interpolation of Histogram Bins我试图理解并实现HoG的三线性插值。达拉尔的论文'在这里:
http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf
我正在努力理解的问题是,据我所知,任务是重新分配到箱子而不是插入已知的箱值。 我很清楚方向维度中的一维情况;
例如,如果我的已知像素梯度方向值为75
且最近的二进制值为z1=60
和z2=80
(二进制步长b=20
),那么像素值(在这种情况下,梯度幅度,比如说w=16
)将以1:3
与相邻区间的比例分布(4个进入60
区域,12
进入{80
1}} bin)对吗?
当涉及需要空间插值的三维情况时,我很难过。我无法理解如何将大小重新分配到适当的箱柜。 对于非常慢的人来说,任何明确的解释都将受到高度赞赏。
答案 0 :(得分:0)
Navneet Dalal讨论的定向梯度直方图,讨论了将细胞的梯度大小插入到定向箱中(对于0到180度,我们有9个箱子,箱子步长或带宽为20度)
一种天真的方法是对窗口/图像中的每个单元格执行此操作,但这会导致混叠效果。为了减少混叠,讨论了应该将图像划分为n×n个单元的块(优选地重叠)
例如。对于64 x 128像素的图像,您可以定义以下内容:
1.单元尺寸= 8x8像素
2.块大小= 2x2个细胞
这给出了:
8x16电池,或
4x8 非重叠块或者
7x15块的步幅为8,即7x15 50%重叠块
因此,不是对每个单元格进行线性直方图插值,而是对块中的单元格进行三线性插值,即三线插值插值:
- 双线性进入空间单元(块)
- 线性进入方向箱
HoG三线性插值的可视化: http://www.ultraimg.com/d7km