创建随机森林后,我用它来预测样本外的测试数据集。但是,连续的预测调用会产生不同的结果:
pred<-predict(rf, test)
pred1<-predict(rf, test)
which(pred!=pred1)
[1] 327 436 492 555 560 738 1264 1336 1339 1521 1772 1775 1780 1820 1826
[16] 2018 2019 2022 2023 2031 2099 2104 2238 2267 2621 3021 3029 3376 3467
关于我如何使这种非确定性的任何想法?
答案 0 :(得分:2)
当使用偶数树时,结果预计是不确定的。来自randomForest doc:
注意2:任何关系都是随机打破的,所以如果这是不合需要的,请在randomForest()中使用奇数ntree来避免它。
因此,如果需要一致的结果,则必须使用奇数个树。