SGDClassifier中的sample_weight如何工作?

时间:2019-04-29 17:14:08

标签: python scikit-learn

我想在训练SGDClassifier时使用重要性抽样。我已经看到sample_weightfit方法中有一个partial_fit参数,但不确定该参数如何工作。

假设我有10个样本,并且我使用了一个权重为10的数组,这些权重会乘以相对样本的损失函数吗?

1 个答案:

答案 0 :(得分:3)

您可以在linear_model.sgd_fast中找到相关的代码,最相关的行是:

update *= class_weight * sample_weight

在每个更新步骤之后,可以根据提供的任何样本或类别权重简单地修改最终更新。

可以在SGD: Weighted samples的用户指南中找到高级结果的示例