我正在研究多类分类问题(总共9个类)。当我想将结果与先前的二进制任务进行比较时,我想知道计算精度和宏分数的方法是否正确。
在下图中显示结果:
基于准确性的定义:the percentage of correctly classified instances
accuracy = (TP + TN)/(TP + TN + FP + FN)
其中TP,FN,FP和TN代表真阳性,假阴性,假阳性和真阴性的数量,以及宏得分的定义:macro-averaged score is computed as a simple arithmetic mean of our per-class scores
(有关详细信息,请阅读{ {3}}),对于第1类和第2类,我以以下方式计算了所有这些分数:
class_1_and_2_accuracy = (TP_class_1 + TP_class_2) / len(class_1 + class_2)
class_1_and_2_macro_f_score = (f_score_class_1 + f_score_class_2) / 2
即在计算准确性时,我考虑了第1类和第2类正确预测的实例的总和除以第1类和第2类正确分类和错误分类的实例总数,而对于宏得分(F分数的定义相同,精度和召回率),我计算了1级和2级的算术平均值。
这种说法正确吗?任何见识将不胜感激。