在交叉验证后对独立数据测试模型是正常的

时间:2018-09-07 16:54:12

标签: r

我想执行一个随机森林模型,所以我将数据分为70%的训练和30%的测试。我对火车数据应用了交叉验证程序(70%),并获得了交叉验证的精度。之后,我在测试数据上测试了我的模型(30%),然后再进行澄清。

所以,我想知道这是否是测试模型鲁棒性的好方法,以及这两种精度的解释是什么。

谢谢。

1 个答案:

答案 0 :(得分:0)

构建RF模型时,您不需要执行交叉验证,因为RF计算自己的CV分数即OOB分数。实际上,您从模型(model_name$confusion处的混淆矩阵)获得的结果基于OOB分数。

您可以使用OOB得分(以及从中得出的各种度量标准,例如Precision,Recall等)从模型列表中选择模型(例如,具有不同参数/参数的模型),然后使用测试数据,以检查所选模型是否推广良好。