我正在尝试根据R中的RANDOMFORESTSRC小插图进行随机森林生存分析。 我有一个包含59个变量的数据框 - 其中14个是数字,其余是因子。数字中的2个是TIME(直到死亡的天数)和DIED(0/1死或不死)。 我遇到了两个问题: 1.
trainrfsrc< - rfsrc(Surv(TIME,DIED)〜。,data = train,nsplit = 10,na.action =" na.impute") trainrfsrc
Sample size: 3228
Number of deaths: 825
Number of trees: 1000
Forest terminal node size: 3
Average no. of terminal nodes: 525.427
没有。在每次拆分中尝试变量:8 总数没有。变量:57 分析:RSF 家人:幸存 拆分规则:logrank 随机 随机分裂点数:10 错误率:17.07%
工作正常,但探索错误率,如:
情节(gg_error(trainrfsrc))+ coord_cartesian(y = c(.09,.31)) 收益: geom_path:每组只包含一个观察。你需要调整群体审美吗?
或 一个&LT ;-( gg_error(trainrfsrc))
一 错误ntree 1 NA 1 2 NA 2 3 NA 3 4 NA 4 5 NA 5 6 NA 6 7 NA 7 8 NA 8 9 NA 9 10 NA 10 所有1000棵树都来了。试过每一棵树都没有错误率?
plot(gg_vimp(trainrfsrc))+ theme(legend.position = c(.8,.2))+ labs(fill =" VIMP> 0")
它返回: 在gg_vimp.rfsrc(trainrfsrc)中: rfsrc对象不包含VIMP信息。计算...
有什么想法吗? 感谢
答案 0 :(得分:-1)
我遇到了同样的问题,并在ggRandomForests手册中找到了原因:
”参数,如果rfsrc对象不包含,则传递给vimp.rfsrc函数 重要信息。”
您可以尝试修改以下代码:
plot(gg_vimp(vimp.rfsrc(trainrfsrc)))
只需在vimp.rfsrc
之前添加trainrfsrc
。希望它能工作。