在scikit-learn中进行逻辑回归时设置类权重的数学原理是什么?

时间:2019-04-22 12:15:34

标签: machine-learning logistic-regression

在python scikit-learn库的逻辑回归算法中,有一个“ class_weight”参数。我想知道在模型拟合期间实现设置class_weight的数学原理是什么。与修改目标功能有关吗?

https://drive.google.com/open?id=16TKZFCwkMXRKx_fMnn3d1rvBWwsLbgAU

具体修改是什么?

先谢谢您! 感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

是的,它会影响丢失功能,并且在标签不平衡时非常常用。在数学上,损失函数只是每个样本损失的加权平均值,其中权重取决于给定样本的类别。如果未使用class_weight,则所有样本都将被均匀加权(如您所附的图片所示)。

这个想法是要惩罚那些代表人数不足的类的错误,而不是惩罚那些代表人数过多的类的错误。

查看更详细的讨论here