Scikit-learn随机森林树 - 如何解释'样本'和'价值'?

时间:2016-06-02 12:58:01

标签: python scikit-learn classification random-forest decision-tree

我用scikit学习包(python)制作了一个随机森林。但是,在展示树木时,似乎有些不对劲。 每个节点的总样本数不是值的总和。此外,与值列表中的位置关联的值似乎与它指定给自己的类标签不对应。

任何想法?提前谢谢。

Click here for sample tree (png)

1 个答案:

答案 0 :(得分:0)

您使用64个样本加星标,所有终止节点共有64个样本。终止节点不必处于同一级别,在这种情况下,三个终止节点在两个决策之后有足够的信息,但其中两个需要第三个。

每当节点分裂时,样本将被分成两个新节点,这两个新节点的组合数量与父节点相同。