我在scikit-learn中构建决策树。搜索stackoverflow可以找到一种方法来提取与每个叶子相关的规则。现在,我的目标是将这些规则应用于新的观察,并查看新观察结果将在哪些叶片中结束。
这是一个抽象的例子。假设我们得到了叶子#1的规则。 a< 5和b> 7,然后观察属于叶#1。现在我想采取新的观察并将这些规则应用于它以检查最终的叶子。
我正在尝试使用决策树进行分段。
答案 0 :(得分:1)
可以找到使用scikit learn的决策树分类器的示例here。此示例包括训练分类器并验证第二个数据集的结果。
predict function可用于在将经过训练的决策树应用于新数据样本时返回结果:
predict(X, check_input=True)
其中X是正在审查的新数据样本的特征向量。
This链接可以帮助您了解如何输出决策树分类器的规则。
答案 1 :(得分:1)
您可以使用apply
的{{1}}方法获取每个样本预测为的hte leaf索引。
DecisionTreeClassifier