标签: scikit-learn logistic-regression
我需要在Sklearn中训练Logistic回归,并在不同类别之间进行不同的利润损失权重。
积极的阶级是一种损失。这意味着每次负面发生时,公司都会花费1.000美元。这显然发生在真阳性和假阴性病例中。
另一方面,每个负面情况(真正否定和假阳性)使公司获得50美元。
问题是:我如何训练SkLearn中的Logistic回归分类器以最大化prifit?
另一个复杂因素是阳性和阴性类别是不平衡的,这意味着阳性代表整体样本量的5%,而阴性则占整体样本量的95%。
感谢您的帮助