在python scikit-learn库的逻辑回归算法中,有一个“ class_weight”参数。我想知道在模型拟合期间实现设置class_weight的数学原理是什么。与修改目标功能有关吗?
https://drive.google.com/open?id=16TKZFCwkMXRKx_fMnn3d1rvBWwsLbgAU
具体修改是什么?
先谢谢您! 感谢您的帮助!
答案 0 :(得分:0)
是的,它会影响丢失功能,并且在标签不平衡时非常常用。在数学上,损失函数只是每个样本损失的加权平均值,其中权重取决于给定样本的类别。如果未使用class_weight
,则所有样本都将被均匀加权(如您所附的图片所示)。
这个想法是要惩罚那些代表人数不足的类的错误,而不是惩罚那些代表人数过多的类的错误。
查看更详细的讨论here。