我知道通常使用种子设置,以便我们可以重现相同的结果。但是,设置种子实际上在随机森林部分做了什么。它是否更改了randomForest()
或nTree
中的sampSize
函数的任何参数。
我每次都在为随机森林模型使用不同的种子,但想知道不同种子如何影响随机森林模型。
答案 0 :(得分:3)
树木从种子生长,森林也是如此;-)(scnr)
构建随机森林有不同的方法,但是,所有共同点是构建了多个树。为了提高单个决策树的分类准确性,随机林中的各个树需要不同,因为您将nTree
倍于同一棵树。通过在树的生成中引入随机性来实现这种差异。随机性受种子的影响,种子最重要的是使用相同的种子应始终产生相同的结果。
随机性如何影响树的构建?有多种方式。 - 为随机子集构建树。这是针对森林的每个单独的树,绘制了训练示例的子集,然后为该子集构建树 - 在树中的每个决策点,随机选择决策属性。
通常将这两个元素组合在一起。
http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1