了解 k 折交叉验证中 ntree 的生成

时间:2021-03-16 19:11:24

标签: machine-learning random-forest cross-validation decision-tree

我想了解随机森林模型在 K 折交叉验证中的工作原理。根据以下元素定义了一个简单的算法:

  1. 决定你想要的折叠次数 (k)

  2. 将数据集细分为 k 折

  3. 对训练集使用 k-1 折来构建模型

  4. 使用测试集来估计有关树中错误的统计数据。

  5. 保存您的结果以备后用

  6. 重复步骤 3-6 k 次,为您的测试集留下不同的折叠。

  7. 平均迭代中的误差以预测整体误差

我不明白的是 ntree 参数在什么级别进行干预。 ntree 是要构建的树的数量。例如,如果我选择 ntree = 500 是不是说在每 k-1 次折叠时,会建造 500 棵新树?并且这些树与之前的 k-1 折叠不同吗?

0 个答案:

没有答案