我想在训练SGDClassifier
时使用重要性抽样。我已经看到sample_weight
和fit
方法中有一个partial_fit
参数,但不确定该参数如何工作。
假设我有10个样本,并且我使用了一个权重为10的数组,这些权重会乘以相对样本的损失函数吗?
答案 0 :(得分:3)
您可以在linear_model.sgd_fast中找到相关的代码,最相关的行是:
update *= class_weight * sample_weight
在每个更新步骤之后,可以根据提供的任何样本或类别权重简单地修改最终更新。
可以在SGD: Weighted samples的用户指南中找到高级结果的示例