Question

*嗨再次我在比较混淆矩阵时遇到了问题。贝娄我提供了两个混淆矩阵。

  a    b      classified as
   349  58      a  tested_negative
   93   124     b  tested_positive

   a    b    classified as
   346  61    a  tested_negative
   90   127   b  tested_positive
i know that the diagonal of top-left to right but here both that value is same so how can i make decision which one best?*

Answer 1

这实际上取决于您的具体应用。假设您希望最大限度地减少误报的数量（因为处理任何误报的后果会花费您很多）

在这种情况下，选择第一个分类器，因为它的误报率低于第二个分类器的误报率：

58 /（58 + 124）＆lt; 61 /（61 + 127） 0.3186813＆lt; 0.3244681

看看这里 http://en.wikipedia.org/wiki/Accuracy_and_precision

在这里： http://en.wikipedia.org/wiki/Sensitivity_and_specificity

如果你只想要“最好的分类器” - 你有一个问题，因为两个分类器具有相同的准确度：

a1 =（349 + 124）/（349 + 124 + 58 + 93）= 0.7580128 a2 =（346 + 127）/（346 + 127 + 61 + 90）= 0.7580128

因此，您需要分析您的域名或行业，并决定是否要：

1）获得尽可能少的误报 - 然后选择具有最小误报率的分类器;

2）尽可能少地错过案例 - 然后选择具有最小假阴性率的分类器;

3）获得更多的命中 - 然后选择具有最大真阳性率的分类器;

4）获得更正确的拒绝 - 然后选择具有最大真实负率的分类器。

WEKA软件分析混淆矩阵

1 个答案: