Question

我正在尝试将决策树如何应用于测试集，并且我正在使用Weka的J48决策树。 Weka通过评估决策树并到达叶子来识别每个样本。当然，多个叶子被标记为相同的类。有没有人知道如何让Weka告诉每个样本它用来标记该样本的叶子？

X < 47
|  Y > 10  : Class1 (...)
|  Y <= 10 : Class2 (...)
X >= 47
|  Y > 15  : Class1 (...)
|  Y <= 15
|  |  Z > 10  : Class2 (...)
|  |  Z <= 10 : Class1 (...)

我想要的是“样品15被归类为Class1，因为（X> = 47，Y <= 15，Z <= 10）”或类似的东西。

或者，我想要的是“27个样本被归类为Class1因为（X> = 47，Y <= 15，Z <= 10）”。

另外，是否有人知道某人已将这些信息可视化的实例，或其他软件是否吐出此信息？感谢。

Answer 1

如果有人知道，我仍然会喜欢真正的答案，但我的回答是Weka不包含这种能力。我的解决方案是做一件能满足我需要的东西。它可以在这里找到：

GitHub:DecisionTreeDNA

我还没完成它。它将用数字构建一个很酷的图表，但它已经吐出了我想要的那些数字。哦 - 它吐出的数字是“27个样本被归类为Class1因为（X> = 47，Y <= 15，Z <= 10）”的变种，但很容易修改以吐出“样本15被分类因为Class1因为（X> = 47，Y <= 15，Z <= 10）“。

输出所选决策树叶

1 个答案: