我正在学习Viola-James检测框架,我读到它使用24x24基本检测窗口[1] [2]。我在理解这个基本检测窗口时遇到了问题。 假设我的图像大小为1280x960像素,其中有3个人。当我尝试对此图像执行面部检测时,算法是否会
感谢任何帮助,甚至是其他解释的链接。
来源:https://www.cs.cmu.edu/~efros/courses/LBMV07/Papers/viola-cvpr-01.pdf
[1] - 第2页,积分图像之前的最后一段
[2] - 第4页,结果
答案 0 :(得分:1)
此视频有帮助吗?这是40分钟。
Adam Harvey Explains Viola-Jones Face Detection
也称为Haar Cascades,该算法非常适合面部检测。
该页面的大约一半是another video,显示正在进行的超慢速扫描,因此您可以看到窗口如何开始变小(尽管为了演示而远大于24x24)并且在周围移动逐像素地逐个图像,然后在连续较大的正方形部分上一次又一次地进行图像处理。在每个阶段,它仍然只是看着那些窗口,好像它们被重新采样到24x24尺寸。
您还可以看到它如何快速拒绝许多窗口,并将大部分时间花在看似面部的区域,同时计算越来越复杂的比较变得越来越严格。这就是术语“级联”发挥作用的地方。
答案 1 :(得分:1)