我正在尝试为生态数据构建一个随机森林,但不断收到错误
“对于类的对象没有适用于'重要性'的方法 “逻辑”。
我的代码是:
fit2 <- randomForest(sv ~ salinity + temp + Depthbin + cdistance + oxygen +
type + diel, data=d.omit, importance(TRUE), ntree=2000)
感兴趣的变量(sv)是连续的,所以我不确定这是否会影响事物。当我删除代码的importance(TRUE)
部分时,我可以运行随机森林,但我获得的IncNodePurity值非常高(某些值超过100,000 !!)。我希望importance(TRUE)
增加会解决这个问题,但如果没有,有没有人知道更好的方法来检查每个变量的重要性?
答案 0 :(得分:1)
试试这个:
fit2 <- randomForest(sv ~ salinity + temp + Depthbin + cdistance + oxygen + type + diel, data=d.omit, importance=TRUE, ntree=2000)
使用importance(fit2)
,您应该能够看到变量的重要性。