我正在尝试根据R中的RANDOMFORESTSRC插图执行随机森林生存分析。我有一个包含59个变量的数据框 - 其中14个是数字,其余是因子。数字中的2个是TIME(直到死亡的天数)和DIED(0/1死或不死)。我遇到了两个问题:
trainrfsrc<- rfsrc(Surv(TIME, DIED) ~ .,
data = train, nsplit = 10, na.action = "na.impute")
trainrfsrc给出:错误率:17.07%
工作正常,但探索错误率,如:
plot(gg_error(trainrfsrc))+ coord_cartesian(y = c(.09,.31))
返回:
geom_path: Each group consists of only one observation. Do you need to adjust the group aesthetic?
或:
a<-(gg_error(trainrfsrc))
a
error ntree 1 NA 1 2 NA 2 3 NA 3 4 NA 4 5 NA 5 6 NA 6 7 NA 7 8 NA 8 9 NA 9 10 NA 10
所有1000棵树的NA。对于每个尝试过的树木,没有错误率吗?
第二个问题是尝试使用VIMP探索最重要的变量,例如:
plot(gg_vimp(trainrfsrc)) + theme(legend.position = c(.8,.2))+ labs(fill = "VIMP > 0")
它返回:
In gg_vimp.rfsrc(trainrfsrc) : rfsrc object does not contain VIMP information. Calculating...
有什么想法吗?感谢
答案 0 :(得分:0)
设置err.block = 1(或1和ntree之间的某个整数)应解决返回NA错误的问题。您可以查看rfsrc下的帮助文件以阅读有关err.block的更多信息。