使用Python中的Logistic回归的预测向量的准确性分数

时间:2017-08-31 10:09:59

标签: python scikit-learn classification logistic-regression multiclass-classification

我使用Logistic回归方法进行多类分类。基本上我知道,如果我使用accuracy_score()函数(例如,来自sklearn库),它会计算出不同值的准确性,如下所示:

y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
accuracy_score(y_true, y_pred)
0.5

但是我希望为每个标签(来自predict_proba)获得顶级Logistic回归预测向量的accuracy_score_new()函数,并计算真实标签是否在此区间内,如下所示:

y_pred = [[0,1,3] [2,1,4], [1,2,5] [3,7,9]]
y_true = [0, 1, 2, 3]
accuracy_score_new(y_true, y_pred)
1

此示例中的accuracy_score_new将等于1,因为分类器会预测标签位于区间中。如何完成这项功能?

2 个答案:

答案 0 :(得分:1)

是的,您可以使用sklearn中的make_scorer函数执行此操作。我们的想法是你定义你的自定义函数,假设它获得了两个参数y_true和y_pred。如果需要,您还可以添加任何其他参数。

以下是一个示例:Custom scoring function

这是另一个例子:Using MSE and R2 score at the same time

This answer也可能有所帮助。

答案 1 :(得分:1)

准确性只是(匹配值/总值)。

所以在你的情况下它会是这样的:

def accuracy_score_new(y_pred, y_true):
    matched = 0
    for y_p, y_t in zip(y_pred, y_true):
        if y_t in y_p:
            matched = matched + 1

    return (matched / (float) len(y_true))