应用错误收集

在scikit-learn中进行逻辑回归时设置类权重的数学原理是什么？

时间：2019-04-22 12:15:34

标签： machine-learning logistic-regression

在python scikit-learn库的逻辑回归算法中，有一个“ class_weight”参数。我想知道在模型拟合期间实现设置class_weight的数学原理是什么。与修改目标功能有关吗？

https://drive.google.com/open?id=16TKZFCwkMXRKx_fMnn3d1rvBWwsLbgAU

具体修改是什么？

先谢谢您！感谢您的帮助！

1 个答案:

答案 0 :(得分：0)

是的，它会影响丢失功能，并且在标签不平衡时非常常用。在数学上，损失函数只是每个样本损失的加权平均值，其中权重取决于给定样本的类别。如果未使用class_weight，则所有样本都将被均匀加权（如您所附的图片所示）。

这个想法是要惩罚那些代表人数不足的类的错误，而不是惩罚那些代表人数过多的类的错误。

查看更详细的讨论here。