Scikit-learn,随机森林 - 每棵树包含多少个样本?

时间:2014-03-15 02:54:39

标签: python scikit-learn random-forest

在scikit-learn的RandomForestClassifier中,没有设置来指定每棵树应该构建多少个样本。也就是说,从数据中随机抽取的子集应该有多大,以构建每个树。

我很难找到默认情况下scikit-learn pulls的样本数量。有谁知道吗?

1 个答案:

答案 0 :(得分:1)

我相信RandomForestClassier将使用整个训练集来构建每棵树。通常构建每棵树涉及选择具有最大预测能力的特征(创建最大“分裂”的特征),并且拥有更多数据使计算更准确。