来自概率的混淆矩阵

时间:2017-11-13 12:41:01

标签: python scikit-learn cross-validation confusion-matrix

我有以下scikit-learn机器学习管道:

cv = StratifiedKFold(n_splits=6)
classifier = svm.SVC(kernel='linear', probability=True,
                     random_state=random_state)

tprs = []
aucs = []
mean_fpr = np.linspace(0, 1, 100)

i = 0
for train, test in cv.split(X, y):
    probas_ = classifier.fit(X[train], y[train]).predict_proba(X[test])
    # Compute ROC curve and area the curve
    fpr, tpr, thresholds = roc_curve(y[test], probas_[:, 1])
    tprs.append(interp(mean_fpr, fpr, tpr))
    tprs[-1][0] = 0.0
    roc_auc = auc(fpr, tpr)
    aucs.append(roc_auc)
    i += 1

现在我想计算(并绘制)混淆矩阵。如何使用上面的代码完成?我只获得概率(我需要用于计算AUC)。我有4个班级(1 ... 4)。

1 个答案:

答案 0 :(得分:1)

您可以在此处使用此示例来绘制混淆矩阵:

但为此,您需要具有离散的类值(不是概率)。可以使用以下命令从probas_变量轻松派生出来:

y_pred = np.argmax(probas_, axis=1)

现在你可以在混淆矩阵中使用这个y_pred