我想了解随机森林模型在 K 折交叉验证中的工作原理。根据以下元素定义了一个简单的算法:
决定你想要的折叠次数 (k)
将数据集细分为 k 折
对训练集使用 k-1 折来构建模型
使用测试集来估计有关树中错误的统计数据。
保存您的结果以备后用
重复步骤 3-6 k 次,为您的测试集留下不同的折叠。
平均迭代中的误差以预测整体误差
我不明白的是 ntree 参数在什么级别进行干预。 ntree 是要构建的树的数量。例如,如果我选择 ntree = 500 是不是说在每 k-1 次折叠时,会建造 500 棵新树?并且这些树与之前的 k-1 折叠不同吗?