如何阅读WEKA中的分类器混淆矩阵

时间:2013-03-05 01:21:40

标签: classification weka decision-tree

抱歉,我是WEKA的新手,只是在学习。

在我的决策树(J48)分类器输出中,存在一个混淆矩阵:

a    b   <----- classified as
130  8     a = functional
15   150   b = non-functional
  • 我如何阅读此矩阵? &amp;和&amp; B'
  • 另外,有人可以向我解释一下域名是什么吗?

2 个答案:

答案 0 :(得分:21)

您是否阅读过wikipedia page on confusion matrices?矩阵周围的文本在它们的示例中排列的方式略有不同(左侧的行标签而不是右侧的行标签),但您只是阅读它。

该行表示真正的类,该列表示分类器输出。然后,每个条目都会给出<row>的实例数,这些实例被归类为<column>。在你的例子中,15个B(被错误地)归类为As,150个B被正确归类为B等等。

因此,所有正确的分类都在左上角到右下角。该对角线上的所有内容都是某种不正确的分类。

编辑:维基百科页面已经切换了行和列。有时候是这样的。在研究混淆矩阵时,请务必检查标签,看它是行中的真实类,列中的预测类还是相反的方式。

答案 1 :(得分:9)

我这样说:

混淆矩阵是Weka报告这个J48模型在正确的方面有多好,以及它出了什么问题。

在您的数据中,目标变量是“功能性”或“非功能性”;矩阵的右侧告诉您“a”列是有效的,“b”是无效的。

这些列告诉您模型如何对样本进行分类 - 这是模型预测的内容:

  • 第一列包含模型认为是“a”的所有样本 - 其中145个,总计
  • 第二列包含模型认为为“b”的所有样本 - 其中158个

另一方面,行代表现实:

  • 第一行包含所有真正属于“a”的样本 - 其中138个,总计
  • 第二行包含所有真正为“b”的样本 - 其中165个

了解列和行,您可以深入了解详细信息:

  • 左上角,130,是你的模特认为是“a”的东西 “a”&lt; - 这些都是正确的
  • 左下角,15,你的模型认为是“a”但是哪个 真的是“b”&lt; - 一种错误
  • 右上角,8,你的模型认为是“b”但是哪个 真的是“一个”&lt; - 另一种错误
  • 右下角,150是您的模型认为是“b”的东西 真的是“b”

矩阵的左上角和右下角显示模型正确的东西。

矩阵的左下角和右上角显示模型混淆的位置。