我一直在尝试使用决策树桩作为弱分类器来实现Adaboost,但我不知道如何优先考虑加权未命中分类实例?
答案 0 :(得分:0)
决策树桩基本上是指定要素,阈值和极性的规则。因此,给定样本,您必须找到具有最低误差的一个特征阈值极性组合。通常计算错误分类并将其除以样本数以获得错误。在Adaboost中使用加权误差,这意味着您不是计算错误分类,而是总结分配给错误分类样本的权重。我希望到目前为止这一点都很清楚。
现在,为了在下一轮中对错误分类的样本给予更高的偏好,您可以通过增加错误分类样本的权重或减少正确分类样本的权重来调整分配给样本的权重。假设E是您的加权误差,您将错误分类的样本权重乘以值(1-E)/ E.由于决策树桩比随机猜测更好,因此E将是< 0.5表示(1-E)/ E>因此,权重增加(例如,E = 0.4 =>(1-E)/ E = 1.5)。另一方面,如果要减少正确分类的样品重量,请改用E /(1-E)。但是,不要忘记之后将权重归一化,使它们总和为1.这对于加权误差的计算很重要。