Question

我在scikit-learn中构建决策树。搜索stackoverflow可以找到一种方法来提取与每个叶子相关的规则。现在，我的目标是将这些规则应用于新的观察，并查看新观察结果将在哪些叶片中结束。

这是一个抽象的例子。假设我们得到了叶子＃1的规则。 a＆lt; 5和b＆gt; 7，然后观察属于叶＃1。现在我想采取新的观察并将这些规则应用于它以检查最终的叶子。

我正在尝试使用决策树进行分段。

Answer 1

可以找到使用scikit learn的决策树分类器的示例here。此示例包括训练分类器并验证第二个数据集的结果。

predict function可用于在将经过训练的决策树应用于新数据样本时返回结果：

 predict(X, check_input=True)

其中X是正在审查的新数据样本的特征向量。

This链接可以帮助您了解如何输出决策树分类器的规则。

Answer 2

您可以使用apply的{{1}}方法获取每个样本预测为的hte leaf索引。

DecisionTreeClassifier