rfsrc对象不包含VIMP信息

时间:2018-04-27 17:04:31

标签: r random-forest

我正在尝试根据R中的RANDOMFORESTSRC小插图进行随机森林生存分析。 我有一个包含59个变量的数据框 - 其中14个是数字,其余是因子。数字中的2个是TIME(直到死亡的天数)和DIED(0/1死或不死)。 我遇到了两个问题: 1.

trainrfsrc< - rfsrc(Surv(TIME,DIED)〜。,data = train,nsplit = 10,na.action =" na.impute") trainrfsrc

  Sample size: 3228
                Number of deaths: 825
                 Number of trees: 1000
       Forest terminal node size: 3
   Average no. of terminal nodes: 525.427

没有。在每次拆分中尝试变量:8               总数没有。变量:57                             分析:RSF                               家人:幸存                       拆分规则:logrank 随机        随机分裂点数:10                           错误率:17.07%

工作正常,但探索错误率,如:

情节(gg_error(trainrfsrc))+ coord_cartesian(y = c(.09,.31)) 收益:  geom_path:每组只包含一个观察。你需要调整群体审美吗?

或 一个&LT ;-( gg_error(trainrfsrc))

  

一          错误ntree   1 NA 1   2 NA 2   3 NA 3   4 NA 4   5 NA 5   6 NA 6   7 NA 7   8 NA 8   9 NA 9   10 NA 10   所有1000棵树都来了。试过每一棵树都没有错误率?

  1. 第二个问题是尝试使用VIMP探索最重要的变量,例如:
  2. plot(gg_vimp(trainrfsrc))+ theme(legend.position = c(.8,.2))+ labs(fill =" VIMP> 0")

    它返回: 在gg_vimp.rfsrc(trainrfsrc)中:   rfsrc对象不包含VIMP信息。计算...

    有什么想法吗? 感谢

1 个答案:

答案 0 :(得分:-1)

我遇到了同样的问题,并在ggRandomForests手册中找到了原因:

  

”参数,如果rfsrc对象不包含,则传递给vimp.rfsrc函数   重要信息。”

您可以尝试修改以下代码:

plot(gg_vimp(vimp.rfsrc(trainrfsrc))) 

只需在vimp.rfsrc之前添加trainrfsrc。希望它能工作。