我正在将sklearn.linear_model.LogisticRegression
用于文本分类项目。利用我提取的特征,样本大部分获得的概率较低。因此,当我使用predict()
时,这些样本始终被归类为0类。但是我要做的是获取样本的实际概率,并根据概率得分选择前25%-30%。如何获得样本的概率分数?在线性回归中,predict()
提供实际输出。但是逻辑回归不是这种情况。我不限于sklearn。也可以使用其他程序包。
更清楚地说,我要从预测函数中返回的是返回实际概率值(S型函数的输出),而不是像线性回归预测函数那样返回类标签。