我正在研究Viola-Jones论文,以便更好地理解他们的物体检测算法并制作适用的程序。在功能主题的最后一段中,作者谈到了24x24的探测器的基本分辨率,他们说详尽的矩形特征集非常大,超过180,000。请注意,与Haar基础不同,矩形特征集是过度完整的。这是否意味着每个矩形特征是24乘24或它只是意味着我们将给定的图像分成24 * 24块? 180000是每24 * 24块找到几种类似哈尔特征的结果?我也无法理解最后一部分说明矩形特征的集合是否过度完整。当我们谈论矩形特征时,过度完整是什么意思?谢谢。
答案 0 :(得分:1)
每个24X24矩形特征只为您提供一个如前所述的相同段落中的一个数字“两个矩形特征的值是两个矩形区域内像素之和的差值”和“三个矩形特征计算”从中心矩形的和中减去两个外部矩形内的和。最后,一个四矩形特征计算矩形对角线对之间的差异。“
有关您可以找到的数字180,00的说明: Viola-Jones' face detection claims 180k features
过度完整集意味着您有一些功能是其他功能的线性组合。在24X24矩形特征的情况下,我们可以通过在其中一个正方形中取值为1的所有矩形并在所有其余正方形中为零来为此空间构建线性基础。如果我们计算出这个配置有多少选项,我们得到24 * 24 = 576,远远小于180,000。这意味着从它们的180,000集中我们可以获得一些矩形,我们可以将它们作为我们集合中其他矩形的组合。