class_weight如何强调scikit-learn中的一个类

时间:2017-01-25 11:22:36

标签: python scikit-learn

我想知道当我们使用参数class_weight时scikit-learn如何更加强调一个类,它是否是少数采样的过采样?

感谢您的帮助。

2 个答案:

答案 0 :(得分:0)

都不是。我认为它会影响损失:

  • 体重较高的班级损失较高。
  • 体重较轻的班级损失较低。

thread中更深入地讨论了这个问题。

答案 1 :(得分:0)

我不确定是否有一种方法可以处理class_weight所有算法。

决策树(和森林)处理此问题的方法是根据每个样本的类别修改权重。

您可以考虑将样本加权作为过采样全部少数类样本的更一般情况(使用权重,您可以“过采样”样本的分数)。