输出所选决策树叶

时间:2012-12-14 03:41:58

标签: machine-learning weka decision-tree

我正在尝试将决策树如何应用于测试集,并且我正在使用Weka的J48决策树。 Weka通过评估决策树并到达叶子来识别每个样本。当然,多个叶子被标记为相同的类。有没有人知道如何让Weka告诉每个样本它用来标记该样本的叶子?

X < 47
|  Y > 10  : Class1 (...)
|  Y <= 10 : Class2 (...)
X >= 47
|  Y > 15  : Class1 (...)
|  Y <= 15
|  |  Z > 10  : Class2 (...)
|  |  Z <= 10 : Class1 (...)

我想要的是“样品15被归类为Class1,因为(X> = 47,Y <= 15,Z <= 10)”或类似的东西。

或者,我想要的是“27个样本被归类为Class1因为(X> = 47,Y <= 15,Z <= 10)”。

另外,是否有人知道某人已将这些信息可视化的实例,或其他软件是否吐出此信息?感谢。

1 个答案:

答案 0 :(得分:0)

如果有人知道,我仍然会喜欢真正的答案,但我的回答是Weka不包含这种能力。我的解决方案是做一件能满足我需要的东西。它可以在这里找到:

GitHub:DecisionTreeDNA

我还没完成它。它将用数字构建一个很酷的图表,但它已经吐出了我想要的那些数字。哦 - 它吐出的数字是“27个样本被归类为Class1因为(X> = 47,Y <= 15,Z <= 10)”的变种,但很容易修改以吐出“样本15被分类因为Class1因为(X> = 47,Y <= 15,Z <= 10)“。