应用错误收集

时间：2016-05-26 12:02:04

标签： image-processing machine-learning computer-vision

我阅读了Dalal and Triggs关于HOG描述的论文和Chris McCormick关于同样的博客。博客说，图像需要以不同的比例重新采样，以识别不同的人。

我的问题是：我们已经有一个窗口放在图像上，尺寸为64 * 128，并在图像上滑动。那么为什么要重新采样而不是将整个窗口滑过可以检测到人的图像。？

如果我错了请纠正，提前谢谢!!

答案 0 :(得分：1)

64 * 128的大小经过培训可分为“人”或“非人”，这是正确的。但是现实世界中的所有人物总是以64 * 128的方式出现吗？

这就是扩展起作用的地方。通过逐步缩小图像，相同的64 * 128像素区域将覆盖原始图像中更大的区域，从而可以检测多种尺寸的人。

例如，以下是我在多个尺度上运行检测后的一个模型的示例。所给出的结果是在应用非最大抑制来排除超常检测窗口之后。