R中使用随机森林预测的不同结果

时间:2017-01-24 13:31:45

标签: r random-forest predict

当我在我的测试数据上运行随机森林模型时,我得到的是相同数据集+模型的不同结果。

以下是您可以看到第一列差异的结果:

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)

        FALSE TRUE
 FALSE    14    7
 TRUE     13   66

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)

        FALSE TRUE
 FALSE    15    7
 TRUE     12   66

虽然差异非常小,但我正在努力了解是什么造成的。我猜测predict具有“灵活”的分类阈值,尽管我在文档中找不到它;我对吗?

提前谢谢

1 个答案:

答案 0 :(得分:5)

我将假设您没有在此处重新设置模型,但只是predict调用产生这些结果。答案可能是这个,来自?predict.randomForest

  

任何关系都是随机打破的,所以如果这是不受欢迎的,请避开它   在randomForest()中使用奇数ntree