树中错误分类的实例与混淆矩阵不匹配

时间:2016-08-27 09:50:08

标签: weka j48

所有规则中不正确分类(见树)的总和是2097(从895 + 700 + 428 + 74)。但混淆矩阵是2121(从1999 + 122)。有人可以解释这种差异吗?为什么数字不同?

tree

confusion matrix

1 个答案:

答案 0 :(得分:1)

分类器模型描述的Weka输出包含两个部分

  1. 培训数据出错
  2. 分层交叉验证
  3. 第一个只评估训练数据本身的训练分类器,而第二个进行交叉验证,在每个折叠中均等地分配每个类的实例。因此,与简单的交叉验证相比,分层交叉验证可以产生更好的分类器性能图。

    我想在这里你发布了分层交叉验证的混淆矩阵&因此,树中显示的错误分类实例的数量(它们必须来自对训练数据的评估)是不同的。

    在链接https://weka.wikispaces.com/Primer#classifiers上非常好地描述了决策树输出。树中显示的错误分类示例与分层交叉验证部分下的混淆矩阵中可以看到的示例不同。

    希望,我是对的。