我是随机森林模型领域的新手,并尝试解释几种射频模型的输出。使用的数据集相当大(大约5,000行以上,5个预测变量,全部是数字),而模型(使用R包randomForest和RandomForestSRC进行比较和更好的绘图)似乎运行良好,我得到%var解释了大约40%,由于某种原因我似乎无法计算OOB错误。它应该与RF摘要中的混淆矩阵一起出现,但我得到的只是例如这样:
我目前使用randomForest包运行的代码是:
rf3 <-randomForest(fishing_hours ~ . , data = data_fish, ntree = 1000, importance=TRUE, do.trace=100)
尝试使用rf3$err.rate[,1]
访问OOB错误率,我将结果列为NULL或列出了NA,并且绘制rf3如下所示:
我正在做回归 - 是否有机会获得错误率或其他有用的模型绩效指标的建议?
非常感谢任何帮助 - 如果需要,很乐意分享样本数据集。
答案 0 :(得分:1)
random.forest
包只在您进行分类时计算OOB错误(err.rate
)和confusion
矩阵。
均方误差通常用于确定回归问题的错误率,您可以从models$mse
访问该错误率。
CrossValidated上的这个答案可能也有帮助: https://stats.stackexchange.com/questions/305046/best-way-to-evaluate-a-random-forest-model-accuracy-on-continuous-data