与一个同事一起,我们目前正在辩论应该为分类算法选择哪种性能指标。
例如,由于存在自相矛盾(https://tryolabs.com/blog/2013/03/25/why-accuracy-alone-bad-measure-classification-tasks-and-what-we-can-do-about-it/),我知道不应该单独使用准确性
最好的方法是使用其中的许多方法(精度,召回率,灵敏度,特异性,F量度,准确性,ROC曲线下面积和/或Kappa)并进行个别解释吗?
或者有什么措施比其他措施更好?