我知道使用精确度和召回的f1分数。 但是,平均f1得分是什么意思? 当我们使用它以及如何计算'均值'时?
编辑以明确解释我的问题: 我知道f1得分是精度和召回的调和平均值。 当我们计算f1得分时,需要多个分类结果来计算精度和召回率。
例如,如果我们有一个由1000个实例组成的数据集,我们就可以得到1000个分类结果。然后我们将它放入列联表中,这样我们就可以计算出f1得分。
现在我的意思是'平均'f1得分。我们从列联表中计算f1得分,但是什么是“平均值”?只有我可以计算的是f1得分,那么什么是'均值'以及如何计算'均值'f1得分?
答案 0 :(得分:3)
F1分数是二元分类任务的测试准确度的度量。在多标签分类任务中,每个文档都有一个F1分数。因此,平均F1分数为:
其中N是火车组的行大小