有没有办法让sk-learn中的分类模型输出预测的置信度或概率,而不仅仅是类(即使只有两个类)?
直观地说,有些样本应该明确归属于一个类别,而其他样本应该是临界的,并且对于某些实际问题来区分这些样本可能是有用的。
答案 0 :(得分:2)
如果你看一下分类器的sklearn文档,你会发现其中一些函数被称为像predict_proba()
(或decision_function
之类的函数,并提到了SVM和其他模型,如Logistic回归)。一个例子是RandomForestClassifier docs here。每个类的概率将以一种取决于特定模型的方式计算,但是它们应该为您输入的每个样本产生每个类的概率。
答案 1 :(得分:1)
是的。通常,您的模型将提供名为decision_function
的成员函数,该函数返回给定样本到分离超平面的距离,您可以将其解释为置信度。
查看此example以了解SVM分类的使用情况。