Viola Jones阈值Haar具有错误值

时间:2016-08-23 20:08:01

标签: algorithm face-detection face-recognition haar-classifier viola-jones

我从2004年开始阅读中提琴论文。在3.1中他们解释了门槛计算。但我很困惑。 它读作

  

对于每个要素,示例都根据要素值

进行排序

问题1)排序列表是根据示例的积分图像计算的haar特征值的列表。因此,如果我们有一个功能和10个图像(正面和负面)。我们得到10个与每个输入图像相关的结果。

  

然后可以计算该特征的AdaBoost最佳阈值   在这个排序列表中单次传递。对于排序中的每个元素   列表,维持和评估四个总和:总和   正例加权T +,负例的总和   权重T - ,低于当前示例S +的正权重之和   以及当前例子S -

以下的负权重之和

问题2)排序的目的是什么。我想最高的那个是最能描述图像的那个。但算法如何影响(S-S + T + T - )。

问题3)现在我们计算排序列表(S-S + T + T-)。这是否意味着每个条目都拥有自己的(S-S + T-T +)或仅存在 整个列表中有一个(S-S + T-T +)。

  

阈值的误差,它分割当前的范围   以及排序列表中的前一个例子是:e = min(S + +(T - - S-),   S- +(T + - S +)),

问题4)这有点回答了我之前的问题,但我不确定。 所以为了让每个输入图像都有“e”。我们需要为列表中的每个条目维护(S-S + T-T +)。但是,在我们为该特征计算N个(每个图像一个)之后,我们如何处理“e”。

提前致谢,如果这令人困惑,请告诉我,或者您需要对我的问题进行更多澄清。

1 个答案:

答案 0 :(得分:3)

  

问题1)排序列表是根据示例的积分图像计算的haar特征值的列表。因此,如果我们有一个功能和10个图像(正面和负面)。我们得到10个与每个输入图像相关的结果。

您将获得该功能的10个结果,其中一个结果与每个输入图像相关联。每张图片都标记为正面或负面。

  

问题2)排序的目的是什么。我想最高的那个是最能描述图像的那个。但算法如何影响(S-S + T + T - )。

具有最高图像的图像是对该要素的响应最高的图像。您根据响应进行排序,而不是基于重量。

你对它们进行排序的原因是你要计算的两件事是"当前例子S +以下的正权重之和以及当前例子S-以下的负权重之和#34; 。如果列表已排序,那么您可以保留一个运行总和,并且在每个点上,所有已添加到总和中的权重的示例将具有小于(即"低于")的特征响应。当前的例子。如果列表没有排序,这不起作用。然后,您可以评估与在该示例和下一个示例之间使用响应级别作为阈值相关的错误。

  

问题3)现在我们计算排序列表(S-S + T + T-)。这是否意味着每个条目都拥有自己的(S-S + T-T +)或整个列表中只有一个(S-S + T-T +)。

每个例子将有一个S和一个S +,因为它&#34;正当量<和>低于当前示例的总和&#34; 。 T +和T-是针对整个列表计算的,我不知道为什么他们说你需要为每个元素维护它。

  问题4)这有点回答了我之前的问题,但我不确定。所以为了让我们对每个输入图像都有&#34; e&#34;我们需要为列表中的每个条目维护(S-S + T-T +)。但我们如何处理&#34; e&#34;在我们计算出该特征的N个(每个图像一个)之后。

您选择了所有这些中的最小值,并且这是放置阈值的最佳位置(这将是这两个示例的响应的中点),因为它具有最小误差(误报+假阴性)。顺便说一下,每个点有两个选择的原因(即e = min(S + +(T - - S - ),S- +(T + - S +)))是你可以选择是否设定阈值以便高于该响应水平的值被认为是正值(第一项),或低于它的值被认为是正值。

如果是前者,那么S +是你的假阳性,(T- - S-)是你的假阴性。如果它是后者,那么S-是你的假阴性,(T + - S +)是你的假阳性。