在HOG功能中重新采样图像的需求是什么?

时间:2016-05-26 12:02:04

标签: image-processing machine-learning computer-vision

我阅读了Dalal and Triggs关于HOG描述的论文和Chris McCormick关于同样的博客。博客说,图像需要以不同的比例重新采样,以识别不同的人。

我的问题是:我们已经有一个窗口放在图像上,尺寸为64 * 128,并在图像上滑动。那么为什么要重新采样而不是将整个窗口滑过可以检测到人的图像。 ?

如果我错了请纠正,提前谢谢!!

1 个答案:

答案 0 :(得分:1)

64 * 128的大小经过培训可分为“人”或“非人”,这是正确的。但是现实世界中的所有人物总是以64 * 128的方式出现吗?

这就是扩展起作用的地方。通过逐步缩小图像,相同的64 * 128像素区域将覆盖原始图像中更大的区域,从而可以检测多种尺寸的人。

例如,以下是我在多个尺度上运行检测后的一个模型的示例。所给出的结果是在应用非最大抑制来排除超常检测窗口之后。