machine-learning - sk-learn分类概率或置信度

sk-learn分类概率或置信度

时间：2015-10-16 03:17:29

标签： machine-learning scikit-learn

有没有办法让sk-learn中的分类模型输出预测的置信度或概率，而不仅仅是类（即使只有两个类）？

直观地说，有些样本应该明确归属于一个类别，而其他样本应该是临界的，并且对于某些实际问题来区分这些样本可能是有用的。

2 个答案:

答案 0 :(得分：2)

如果你看一下分类器的sklearn文档，你会发现其中一些函数被称为像predict_proba()（或decision_function之类的函数，并提到了SVM和其他模型，如Logistic回归）。一个例子是RandomForestClassifier docs here。每个类的概率将以一种取决于特定模型的方式计算，但是它们应该为您输入的每个样本产生每个类的概率。

答案 1 :(得分：1)

是的。通常，您的模型将提供名为decision_function的成员函数，该函数返回给定样本到分离超平面的距离，您可以将其解释为置信度。

查看此example以了解SVM分类的使用情况。