应用错误收集

时间：2016-03-30 11:26:58

标签： r machine-learning random-forest

我知道通常使用种子设置，以便我们可以重现相同的结果。但是，设置种子实际上在随机森林部分做了什么。它是否更改了randomForest()或nTree中的sampSize函数的任何参数。

我每次都在为随机森林模型使用不同的种子，但想知道不同种子如何影响随机森林模型。

答案 0 :(得分：3)

树木从种子生长，森林也是如此;-)（scnr）

构建随机森林有不同的方法，但是，所有共同点是构建了多个树。为了提高单个决策树的分类准确性，随机林中的各个树需要不同，因为您将nTree倍于同一棵树。通过在树的生成中引入随机性来实现这种差异。随机性受种子的影响，种子最重要的是使用相同的种子应始终产生相同的结果。

随机性如何影响树的构建？有多种方式。 - 为随机子集构建树。这是针对森林的每个单独的树，绘制了训练示例的子集，然后为该子集构建树 - 在树中的每个决策点，随机选择决策属性。

通常将这两个元素组合在一起。