抱歉,我是WEKA的新手,只是在学习。
在我的决策树(J48)分类器输出中,存在一个混淆矩阵:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
答案 0 :(得分:21)
您是否阅读过wikipedia page on confusion matrices?矩阵周围的文本在它们的示例中排列的方式略有不同(左侧的行标签而不是右侧的行标签),但您只是阅读它。
该行表示真正的类,该列表示分类器输出。然后,每个条目都会给出<row>
的实例数,这些实例被归类为<column>
。在你的例子中,15个B(被错误地)归类为As,150个B被正确归类为B等等。
因此,所有正确的分类都在左上角到右下角。该对角线上的所有内容都是某种不正确的分类。
编辑:维基百科页面已经切换了行和列。有时候是这样的。在研究混淆矩阵时,请务必检查标签,看它是行中的真实类,列中的预测类还是相反的方式。
答案 1 :(得分:9)
我这样说:
混淆矩阵是Weka报告这个J48模型在正确的方面有多好,以及它出了什么问题。
在您的数据中,目标变量是“功能性”或“非功能性”;矩阵的右侧告诉您“a”列是有效的,“b”是无效的。
这些列告诉您模型如何对样本进行分类 - 这是模型预测的内容:
另一方面,行代表现实:
了解列和行,您可以深入了解详细信息:
矩阵的左上角和右下角显示模型正确的东西。
矩阵的左下角和右上角显示模型混淆的位置。