如何在adaboost中实现重量?

时间:2016-03-11 04:47:24

标签: machine-learning adaboost

AdaBoost需要更新不同数据点的权重。但是大多数机器学习算法并没有考虑数据的权重。那么有一种常用的方法来实现机器学习算法(如SVM或神经网络)的权重吗?

1 个答案:

答案 0 :(得分:0)

有两种解决方案,特别是使用的分类器和通用方法。

你要求的是后者,而如果存在特定方法,前者总是优先考虑。如果权重不可用,您可能会发现使用搜索字词成本敏感的内容。原因是以下算法提供了不理想的结果。

但是,如果无法获得体重敏感的训练方法。您可以使用加权抽样。我们的想法是使用带有替换的采样生成派生训练集。训练样例出现在训练集中的概率与其体重有关。例如,如果你有加权集

  (e1,0.2),(e2,0.4),(e3,0.8)

作为第一个示例选择的e3包含的概率为4/7。 然而,这种方法的问题是显而易见的。要获得精确的表示,我们必须生成至少包含7个元素的trainigset。这显着增加了运行时间尽管如此,为了提高训练期间加权的准确性并不重要。