*嗨再次我在比较混淆矩阵时遇到了问题。贝娄我提供了两个混淆矩阵。
a b classified as
349 58 a tested_negative
93 124 b tested_positive
a b classified as
346 61 a tested_negative
90 127 b tested_positive
i know that the diagonal of top-left to right but here both that value is same so how can i make decision which one best?*
答案 0 :(得分:1)
这实际上取决于您的具体应用。 假设您希望最大限度地减少误报的数量(因为处理任何误报的后果会花费您很多)
在这种情况下,选择第一个分类器,因为它的误报率低于第二个分类器的误报率:
58 /(58 + 124)< 61 /(61 + 127) 0.3186813< 0.3244681
看看这里 http://en.wikipedia.org/wiki/Accuracy_and_precision
在这里: http://en.wikipedia.org/wiki/Sensitivity_and_specificity
如果你只想要“最好的分类器” - 你有一个问题,因为两个分类器具有相同的准确度:
a1 =(349 + 124)/(349 + 124 + 58 + 93)= 0.7580128 a2 =(346 + 127)/(346 + 127 + 61 + 90)= 0.7580128
因此,您需要分析您的域名或行业,并决定是否要:
1)获得尽可能少的误报 - 然后选择具有最小误报率的分类器;
2)尽可能少地错过案例 - 然后选择具有最小假阴性率的分类器;
3)获得更多的命中 - 然后选择具有最大真阳性率的分类器;
4)获得更正确的拒绝 - 然后选择具有最大真实负率的分类器。