我看过Rapid Object Detection using a Boosted Cascade of Simple Features。在第3部分中,它定义了一个弱分类器:
我的问题是:如何指定阈值theta_j
?
对于强大的班主任,我的问题是这样的:
答案 0 :(得分:1)
弱学习者为每个特征计算参数theta_j
。 Viola和Jones的方法更好地记录在他们的2004 version of their paper中,并且,恕我直言,与ROC analysis非常相似。您必须针对训练集测试每个弱分类器,以查找导致最小加权误差的theta_j
。我们说“加权”是因为我们使用与每个训练样本相关联的w_t,i
值来加权错误分类。
有关强分类器阈值的直观答案,请考虑所有alpha_t = 1
。这意味着对于x
的强分类器输出1,您应该至少有一半弱分类器为x
输出1。请记住,弱分类器如果认为x
是面,则输出1,否则输出0
。
在Adaboost中,alpha_t
可以被认为是弱定性者质量的衡量标准,即弱分类器犯的错误越少the higher its alpha
will be。由于一些弱分类器比其他分类器更好,因此根据质量来衡量投票似乎是一个好主意。强分类器不等式的右手反映出,如果权重加起来至少占所有权重的50%,则将x
分类为1(面部)。
答案 1 :(得分:0)
您需要确定每个要素的theta_j。这是弱分类器的训练步骤。通常,找到最佳theta_j取决于弱分类器的模型。在这种特殊情况下,您需要检查此特定功能对您的训练数据采用的所有值,并查看哪些值将导致最低的错误分类率。这将是你的theta_j。