sk-learn分类概率或置信度

时间:2015-10-16 03:17:29

标签: machine-learning scikit-learn

有没有办法让sk-learn中的分类模型输出预测的置信度或概率,而不仅仅是类(即使只有两个类)?

直观地说,有些样本应该明确归属于一个类别,而其他样本应该是临界的,并且对于某些实际问题来区分这些样本可能是有用的。

2 个答案:

答案 0 :(得分:2)

如果你看一下分类器的sklearn文档,你会发现其中一些函数被称为像predict_proba()(或decision_function之类的函数,并提到了SVM和其他模型,如Logistic回归)。一个例子是RandomForestClassifier docs here。每个类的概率将以一种取决于特定模型的方式计算,但是它们应该为您输入的每个样本产生每个类的概率。

答案 1 :(得分:1)

是的。通常,您的模型将提供名为decision_function的成员函数,该函数返回给定样本到分离超平面的距离,您可以将其解释为置信度。

查看此example以了解SVM分类的使用情况。