在scikit-learn中的叶子排序

时间:2016-09-21 14:32:42

标签: scikit-learn decision-tree

我正在scikit-learn中构建决策树,而树正缺少#2叶。我想知道为什么?这是我的例子:

import numpy as np
from sklearn.tree import DecisionTreeClassifier, export_graphviz

def leaf_ordering():
    X = np.genfromtxt('X.csv', delimiter=',')
    Y = np.genfromtxt('Y.csv',delimiter=',')
    dt = DecisionTreeClassifier(min_samples_leaf=100, random_state=99)
    dt.fit(X, Y)
    print(set(dt.apply(X)))

leaf_ordering()

指向文件X的链接 链接到档案Y

输出结果为:{1, 3, 4}。如你所见,没有叶子#2。

1 个答案:

答案 0 :(得分:1)

示例中的节点02都是非叶节点。在下面的示例中,您可以从导出中看到014都是内部树节点,23,{ {1}}和5是叶子,因此所有预测都将在其中一个中。

6