大多数在线反馈都表示,对于“随机森林”方法,无需将数据分为训练和测试集。但是,我正在尝试使用以下Bagging(ipred)函数,并且我不知道是否需要先将数据分为训练集和测试集?
我应该使用拆分训练集还是使用完整数据集来运行下面的baggedsample模型?
baggedsample <- bagging(p ~., fulldata, nbagg=500, coob=TRUE, control =
list (minbucket=5))
此外,我想为上述模型获得R-Squared的“ out of bag”,但以下代码仅输出“ out of bag” rmse:
rmse <- baggedsample$err
感谢对此事的任何建议。