随机森林问题具有重要性

时间:2017-05-18 04:38:37

标签: r random-forest

我正在尝试为生态数据构建一个随机森林,但不断收到错误

  

“对于类的对象没有适用于'重要性'的方法   “逻辑”。

我的代码是:

fit2 <- randomForest(sv ~ salinity + temp + Depthbin +  cdistance + oxygen + 
                      type + diel, data=d.omit, importance(TRUE), ntree=2000)

感兴趣的变量(sv)是连续的,所以我不确定这是否会影响事物。当我删除代码的importance(TRUE)部分时,我可以运行随机森林,但我获得的IncNodePurity值非常高(某些值超过100,000 !!)。我希望importance(TRUE)增加会解决这个问题,但如果没有,有没有人知道更好的方法来检查每个变量的重要性?

1 个答案:

答案 0 :(得分:1)

试试这个:

fit2 <- randomForest(sv ~ salinity + temp + Depthbin + cdistance + oxygen + type + diel, data=d.omit, importance=TRUE, ntree=2000)

使用importance(fit2),您应该能够看到变量的重要性。