不确定是否已针对Python回答了这个问题,但我找不到R的答案。
我有一个分类器,它将生成混淆矩阵。我正在用R编写显式函数,以处理这些函数的性能指标。此类功能(用于精度和召回率的措施)已在Internet和StackOverflow上提供。计算完类的精度并回想起之后,我将对每个对象使用宏平均值(即平均值)。
我想知道的是,如果我期望有很多零,那么在取平均值之前用类级精度替换丢失的值并用0
调用是否更有意义?使用na.rm=TRUE
(即只是打折那些条目)?
使用0
来提高精度是否有意义,因为如果该类中未进行任何预测,这是算法的“错误”,但是对于召回,我们应该使用na.rm=TRUE
(因为这是一个方面数据本身(如果一行没有条目,意味着一个类没有实例)?您如何看待,对于我应该如何处理这些宏观平均值的情况有何建议?