scikit-learn:交叉验证评分是否评估了日志丢失函数?

时间:2015-10-20 08:17:01

标签: python machine-learning scikit-learn cross-validation

在python sklearn中,我使用随机梯度下降来执行多类分类,最小化对数损失函数。

clf = SGDClassifier(loss="log", penalty="l2")

当我对我的测试集执行交叉验证时,对于每次数据拆分,我计算:

score = clf.fit(X_train, y_train).score(X_test, y_test)

分数是损失函数的评估吗?

对于每个交叉验证拆分,我的得分始终为0.0。那么这是否意味着我的分类器正确地标记了我的测试数据,或者它是否意味着我的准确度非常低?

1 个答案:

答案 0 :(得分:1)

Here确实如此。它与损失功能无关。

  

返回给定测试数据和标签的平均准确度。

     

在多标签分类中,这是a的子集精度   苛刻的指标,因为您需要每个标签集的每个样本   正确预测。

它在里面使用accuracy_score函数。

  

准确性分类得分。

     

在多标签分类中,此函数计算子集精度:   为样本预测的标签集必须完全匹配   y_true中相应的标签集。

0.0表示您的分类器无法正确分类X_test中的任何样本。