为什么F1测量对评估多类分类器有效?

时间:2018-05-05 13:18:29

标签: machine-learning multiclass-classification

我一直在为多类分类器寻找一个好的误差度量标准,很多人说通常使用F1测量。 但鉴于多类分类器的预测是一个热门的向量,它不意味着当预测错误时没有真正的积极因素吗? 我的意思是:

image

当预测正确时,除了单个'1'之外,每个元素都是真阴性。所以这里的精度只有1。

image

当预测不正确时,没有真正的积极因素。所以精度为0。

我理解F1在多标签分类方面是一种强大的度量方法,因为向量中可以有多个1,但在多类分类上应用F1对我来说似乎有点奇怪。只是准确度不一样吗? 或者是否意味着应该使用每个级别

1 个答案:

答案 0 :(得分:0)

我建议看一下Wikipedia,尤其是“扩展到多类分类”部分。

Coursera上找到了有关如何将F1应用于多类分类器的很好的解释。