HOG Trilinear插值直方图箱澄清

时间:2013-07-19 05:11:44

标签: algorithm computer-vision histogram

像我之前的其他人一样HOG Trilinear Interpolation of Histogram Bins我试图理解并实现HoG的三线性插值。达拉尔的论文'在这里:

http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf

我正在努力理解的问题是,据我所知,任务是重新分配到箱子而不是插入已知的箱值。 我很清楚方向维度中的一维情况;

例如,如果我的已知像素梯度方向值为75且最近的二进制值为z1=60z2=80(二进制步长b=20),那么像素值(在这种情况下,梯度幅度,比如说w=16)将以1:3与相邻区间的比例分布(4个进入60区域,12进入{80 1}} bin)对吗?

当涉及需要空间插值的三维情况时,我很难过。我无法理解如何将大小重新分配到适当的箱柜。 对于非常慢的人来说,任何明确的解释都将受到高度赞赏。

1 个答案:

答案 0 :(得分:0)

Navneet Dalal讨论的定向梯度直方图,讨论了将细胞的梯度大小插入到定向箱中(对于0到180度,我们有9个箱子,箱子步长或带宽为20度)

一种天真的方法是对窗口/图像中的每个单元格执行此操作,但这会导致混叠效果。为了减少混叠,讨论了应该将图像划分为n×n个单元的块(优选地重叠) 例如。对于64 x 128像素的图像,您可以定义以下内容:
1.单元尺寸= 8x8像素
2.块大小= 2x2个细胞

这给出了:
8x16电池,或
4x8 非重叠块或者 7x15块的步幅为8,即7x15 50%重叠块

因此,不是对每个单元格进行线性直方图插值,而是对块中的单元格进行三线性插值,即三线插值插值:
  - 双线性进入空间单元(块)   - 线性进入方向箱

HoG三线性插值的可视化: http://www.ultraimg.com/d7km