我正在尝试将决策树如何应用于测试集,并且我正在使用Weka的J48决策树。 Weka通过评估决策树并到达叶子来识别每个样本。当然,多个叶子被标记为相同的类。有没有人知道如何让Weka告诉每个样本它用来标记该样本的叶子?
X < 47
| Y > 10 : Class1 (...)
| Y <= 10 : Class2 (...)
X >= 47
| Y > 15 : Class1 (...)
| Y <= 15
| | Z > 10 : Class2 (...)
| | Z <= 10 : Class1 (...)
我想要的是“样品15被归类为Class1,因为(X> = 47,Y <= 15,Z <= 10)”或类似的东西。
或者,我想要的是“27个样本被归类为Class1因为(X> = 47,Y <= 15,Z <= 10)”。
另外,是否有人知道某人已将这些信息可视化的实例,或其他软件是否吐出此信息?感谢。
答案 0 :(得分:0)
如果有人知道,我仍然会喜欢真正的答案,但我的回答是Weka不包含这种能力。我的解决方案是做一件能满足我需要的东西。它可以在这里找到:
我还没完成它。它将用数字构建一个很酷的图表,但它已经吐出了我想要的那些数字。哦 - 它吐出的数字是“27个样本被归类为Class1因为(X> = 47,Y <= 15,Z <= 10)”的变种,但很容易修改以吐出“样本15被分类因为Class1因为(X> = 47,Y <= 15,Z <= 10)“。