RandomForestSRC错误和vimp

时间:2018-05-01 17:32:19

标签: random-forest survival-analysis

我正在尝试根据R中的RANDOMFORESTSRC插图执行随机森林生存分析。我有一个包含59个变量的数据框 - 其中14个是数字,其余是因子。数字中的2个是TIME(直到死亡的天数)和DIED(0/1死或不死)。我遇到了两个问题:

trainrfsrc<- rfsrc(Surv(TIME, DIED) ~ .,
                   data = train, nsplit = 10, na.action = "na.impute") 

trainrfsrc给出:错误率:17.07%

工作正常,但探索错误率,如:

plot(gg_error(trainrfsrc))+ coord_cartesian(y = c(.09,.31)) 

返回:

geom_path: Each group consists of only one observation. Do you need to adjust the group aesthetic?

或:

a<-(gg_error(trainrfsrc))

a 
error ntree 1 NA 1 2 NA 2 3 NA 3 4 NA 4 5 NA 5 6 NA 6 7 NA 7 8 NA 8 9 NA 9 10 NA 10 

所有1000棵树的NA。对于每个尝试过的树木,没有错误率吗?

第二个问题是尝试使用VIMP探索最重要的变量,例如:

plot(gg_vimp(trainrfsrc)) + theme(legend.position = c(.8,.2))+ labs(fill = "VIMP > 0")

它返回:

In gg_vimp.rfsrc(trainrfsrc) : rfsrc object does not contain VIMP information. Calculating...

有什么想法吗?感谢

1 个答案:

答案 0 :(得分:0)

设置err.block = 1(或1和ntree之间的某个整数)应解决返回NA错误的问题。您可以查看rfsrc下的帮助文件以阅读有关err.block的更多信息。