当我在我的测试数据上运行随机森林模型时,我得到的是相同数据集+模型的不同结果。
以下是您可以看到第一列差异的结果:
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 14 7
TRUE 13 66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 15 7
TRUE 12 66
虽然差异非常小,但我正在努力了解是什么造成的。我猜测predict
具有“灵活”的分类阈值,尽管我在文档中找不到它;我对吗?
提前谢谢
答案 0 :(得分:5)
我将假设您没有在此处重新设置模型,但只是predict
调用产生这些结果。答案可能是这个,来自?predict.randomForest
:
任何关系都是随机打破的,所以如果这是不受欢迎的,请避开它 在randomForest()中使用奇数ntree