Viola-Jones - 24x24窗口是什么意思?

时间:2015-08-11 21:56:20

标签: viola-jones

我正在学习Viola-James检测框架,我读到它使用24x24基本检测窗口[1] [2]。我在理解这个基本检测窗口时遇到了问题。 假设我的图像大小为1280x960像素,其中有3个人。当我尝试对此图像执行面部检测时,算法是否会

  1. 将图片缩小为24x24像素,
  2. 使用24x24像素大的部分平铺图片,然后测试每个部分,
  3. 将24x24窗口放在图像的左上角,然后在整个图像区域上移动1个像素?
  4. 感谢任何帮助,甚至是其他解释的链接。

    来源:https://www.cs.cmu.edu/~efros/courses/LBMV07/Papers/viola-cvpr-01.pdf

    [1] - 第2页,积分图像之前的最后一段

    [2] - 第4页,结果

2 个答案:

答案 0 :(得分:1)

此视频有帮助吗?这是40分钟。

Adam Harvey Explains Viola-Jones Face Detection

也称为Haar Cascades,该算法非常适合面部检测。

该页面的大约一半是another video,显示正在进行的超慢速扫描,因此您可以看到窗口如何开始变小(尽管为了演示而远大于24x24)并且在周围移动逐像素地逐个图像,然后在连续较大的正方形部分上一次又一次地进行图像处理。在每个阶段,它仍然只是看着那些窗口,好像它们被重新采样到24x24尺寸。

您还可以看到它如何快速拒绝许多窗口,并将大部分时间花在看似面部的区域,同时计算越来越复杂的比较变得越来越严格。这就是术语“级联”发挥作用的地方。

答案 1 :(得分:1)

我发现这段视频完美地解释了检测窗口如何在图片上移动和缩放。我想绘制一个流程图,但我认为视频更好地说明了这一点:

https://vimeo.com/12774628

致视频原作者的信用。