f1_score中pos_label的真正含义是什么?

时间:2015-11-20 16:46:29

标签: machine-learning scikit-learn classification

我在sklearn中尝试k_fold交叉验证,并且对f1_score中的pos_label参数感到困惑。据我所知,如果类别不是二进制,pos_label参数与如何处理数据有关。但我对它的意义并没有很好的概念性理解 - 是否有人对概念层面的含义有很好的解释?

我已经阅读了文档,但他们并没有真正帮助。

1 个答案:

答案 0 :(得分:4)

f1得分为harmonic mean of precision and recall。因此,您需要计算precision and recall来计算f1分数。这两项指标均参考“真阳性”(指定正面标签的正面实例),“误报”(指定正面标签的负面实例)等计算。

pos_label参数允许您指定哪个类应该被视为“正”,以便进行此计算。

更具体地说,想象一下你正在尝试建立一个分类器,在一个无趣的事件的大背景中发现一些罕见的事件。一般而言,您所关心的是如何识别这些罕见的结果;背景标签本质上并不有趣。在这种情况下,您可以将pos_label设置为您感兴趣的课程。如果您处于关注所有类结果的情况,f1_score可能不是合适的指标。