F1 micro与Accuracy相同吗?

时间:2016-05-21 03:14:10

标签: machine-learning scikit-learn svm

我尝试过很多关于F1微型和精确度的scikit-learn的例子,在所有这些例子中,我看到F1 micro与Accuracy相同。这总是如此吗?

脚本

from sklearn import svm
from sklearn import metrics
from sklearn.cross_validation import train_test_split
from sklearn.datasets import load_iris
from sklearn.metrics import f1_score, accuracy_score

# prepare dataset
iris = load_iris()
X = iris.data[:, :2]
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# svm classification
clf = svm.SVC(kernel='rbf', gamma=0.7, C = 1.0).fit(X_train, y_train)
y_predicted = clf.predict(X_test)

# performance
print "Classification report for %s" % clf
print metrics.classification_report(y_test, y_predicted)

print("F1 micro: %1.4f\n" % f1_score(y_test, y_predicted, average='micro'))
print("F1 macro: %1.4f\n" % f1_score(y_test, y_predicted, average='macro'))
print("F1 weighted: %1.4f\n" % f1_score(y_test, y_predicted, average='weighted'))
print("Accuracy: %1.4f" % (accuracy_score(y_test, y_predicted)))

输出

Classification report for SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape=None, degree=3, gamma=0.7, kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
             precision    recall  f1-score   support

          0       1.00      0.90      0.95        10
          1       0.50      0.88      0.64         8
          2       0.86      0.50      0.63        12

avg / total       0.81      0.73      0.74        30

F1 micro: 0.7333

F1 macro: 0.7384

F1 weighted: 0.7381

Accuracy: 0.7333

F1 micro =准确度

4 个答案:

答案 0 :(得分:10)

在保证每个测试用例仅分配给一个类的分类任务中,micro-F等同于准确性。在多标签分类中不会出现这种情况。

答案 1 :(得分:1)

对于每个实例必须归为一类(并且只有一个)的情况,平均精度,召回率,f1和准确性均相等。一种简单的查看方法是查看公式precision = TP /(TP + FP)和召回率= TP /(TP + FN)。分子是相同的,一个类的每个FN都是另一类的FP,这使得分母也相同。如果精度=召回率,则f1也将等于。

对于任何输入,都应该能够表明:

from sklearn.metrics import accuracy_score as acc
from sklearn.metrics import f1_score as f1
f1(y_true,y_pred,average='micro')=acc(y_true,y_pred)

答案 2 :(得分:1)

这是因为我们正在处理一个多类别分类,其中每个测试数据应该只属于 1 个类别而不是多标签,在没有 TN 的情况下,我们可以将 True Negatives 称为 True Positives。

>

公式化,

enter image description here

更正:F1 得分为 2* 精确率* 召回率/(精确率 + 召回率)

enter image description here

答案 3 :(得分:0)

我遇到了同样的问题,因此我进行了调查并提出了以下建议:

仅考虑理论,就不可能对每个数据集都保持相同的准确性和f1-score。这样做的原因是f1-score与真负数无关,而准确性与真负数无关。

通过获取其中f1 = acc的数据集并向其中添加真实的负数,您得到f1 != acc

>>> from sklearn.metrics import accuracy_score as acc
>>> from sklearn.metrics import f1_score as f1
>>> y_pred = [0, 1, 1, 0, 1, 0]
>>> y_true = [0, 1, 1, 0, 0, 1]
>>> acc(y_true, y_pred)
0.6666666666666666
>>> f1(y_true,y_pred)
0.6666666666666666
>>> y_true = [0, 1, 1, 0, 1, 0, 0, 0, 0]
>>> y_pred = [0, 1, 1, 0, 0, 1, 0, 0, 0]
>>> acc(y_true, y_pred)
0.7777777777777778
>>> f1(y_true,y_pred)
0.6666666666666666