我正在学习HOG,我从here了解到了。带有示例的详细解释页面。我不了解这个概念是如何工作的
一个16×16块具有4个直方图,这些直方图可以串联形成一个36 x 1个元素向量,可以将其标准化为3×1向量 已标准化。
这个 36 * 1 是如何产生的以及我们如何计算的?始终需要9 bin向量是强制性的吗?它是HOG的固定大小吗?
来了吗?
答案 0 :(得分:2)
我们总是需要9 bin向量吗?
不一定。 Dalal和Triggs在their original HOG paper中指出,使用多达9个垃圾箱时,其应用(人类行人检测)的准确性提高了,此后准确性没有进一步提高,这就是为什么通常使用9种。
这36 * 1是如何产生的以及我们如何计算的?
正如评论中已经指出的那样:
您每个直方图有 9个垃圾箱(每个垃圾箱都是特征向量中的标量值)。在您的示例中,直方图是使用 8 x 8 块计算的,这意味着在 16 x 16 块中,您将能够计算 4个直方图 。每个直方图都会产生 9 x 1 特征向量,因此:
4 (直方图)* 9 (bin)= 36 x 1 特征向量。
基本上,您只是将结果串联到一个向量中。