Question

我希望获得每个预测的置信度分数，显示分类器对预测它是否正确的肯定程度。

我想要这样的事情：

分类器的预测有多确定？

1级：81％，这是1级第2类：10％
第3类：6％
4级：3％

我的代码示例：

features_train, features_test, labels_train, labels_test = cross_validation.train_test_split(main, target, test_size = 0.4)

# Determine amount of time to train
t0 = time()
model = SVC()
#model = SVC(kernel='poly')
#model = GaussianNB()

model.fit(features_train, labels_train)

print 'training time: ', round(time()-t0, 3), 's'

# Determine amount of time to predict
t1 = time()
pred = model.predict(features_test)

print 'predicting time: ', round(time()-t1, 3), 's'

accuracy = accuracy_score(labels_test, pred)

print 'Confusion Matrix: '
print confusion_matrix(labels_test, pred)

# Accuracy in the 0.9333, 9.6667, 1.0 range
print accuracy



model.predict(sub_main)

# Determine amount of time to predict
t1 = time()
pred = model.predict(sub_main)

print 'predicting time: ', round(time()-t1, 3), 's'

print ''
print 'Prediction: '
print pred

我怀疑我会使用score（）函数，但我似乎仍在继续正确实现它。我不知道这是否是正确的功能，但是如何获得分类器预测的置信度？

Answer 1

根据SVC documentation，您似乎需要更改构建SVC的方式：

model = SVC(probability=True)

然后使用predict_proba方法：

class_probabilities = model.predict_proba(sub_main)

Answer 2

对于那些实施predict_proba()方法的估算工具，就像Justin Peel建议的那样，您可以使用predict_proba()来预测您的概率。

对于那些没有实现predict_proba()方法的估算器，您可以使用bootstrap概念自己构建置信区间（在许多子样本中重复计算您的点估计值）。

如果您需要任何详细的示例来证明这两种情况，请告诉我。

如何获得分类器对sklearn预测的置信度？

2 个答案: