WEKA软件分析混淆矩阵

时间:2014-04-16 08:55:17

标签: matrix weka confusion-matrix

*嗨再次我在比较混淆矩阵时遇到了问题。贝娄我提供了两个混淆矩阵。

  a    b      classified as
   349  58      a  tested_negative
   93   124     b  tested_positive

   a    b    classified as
   346  61    a  tested_negative
   90   127   b  tested_positive
i know that the diagonal of top-left to right but here both that value is same so how can i make decision which one best?*

1 个答案:

答案 0 :(得分:1)

这实际上取决于您的具体应用。 假设您希望最大限度地减少误报的数量(因为处理任何误报的后果会花费您很多)

在这种情况下,选择第一个分类器,因为它的误报率低于第二个分类器的误报率:

58 /(58 + 124)< 61 /(61 + 127) 0.3186813< 0.3244681

看看这里 http://en.wikipedia.org/wiki/Accuracy_and_precision

在这里: http://en.wikipedia.org/wiki/Sensitivity_and_specificity

如果你只想要“最好的分类器” - 你有一个问题,因为两个分类器具有相同的准确度:

a1 =(349 + 124)/(349 + 124 + 58 + 93)= 0.7580128 a2 =(346 + 127)/(346 + 127 + 61 + 90)= 0.7580128

因此,您需要分析您的域名或行业,并决定是否要:

1)获得尽可能少的误报 - 然后选择具有最小误报率的分类器;

2)尽可能少地错过案例 - 然后选择具有最小假阴性率的分类器;

3)获得更多的命中 - 然后选择具有最大真阳性率的分类器;

4)获得更正确的拒绝 - 然后选择具有最大真实负率的分类器。