种子在随机森林中做了什么?

时间:2016-03-30 11:26:58

标签: r machine-learning random-forest

我知道通常使用种子设置,以便我们可以重现相同的结果。但是,设置种子实际上在随机森林部分做了什么。它是否更改了randomForest()nTree中的sampSize函数的任何参数。

我每次都在为随机森林模型使用不同的种子,但想知道不同种子如何影响随机森林模型。

1 个答案:

答案 0 :(得分:3)

树木从种子生长,森林也是如此;-)(scnr)

构建随机森林有不同的方法,但是,所有共同点是构建了多个树。为了提高单个决策树的分类准确性,随机林中的各个树需要不同,因为您将nTree倍于同一棵树。通过在树的生成中引入随机性来实现这种差异。随机性受种子的影响,种子最重要的是使用相同的种子应始终产生相同的结果。

随机性如何影响树的构建?有多种方式。   - 为随机子集构建树。这是针对森林的每个单独的树,绘制了训练示例的子集,然后为该子集构建树   - 在树中的每个决策点,随机选择决策属性。

通常将这两个元素组合在一起。

http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1