如何修复randomForestSRC,使“地板”对因素错误没有意义

时间:2019-04-11 14:05:59

标签: r

我正在使用randomForestSRC来评估34种潜在生存预测因素的可变重要性。当所有潜在的预测变量都是数字(或编码为数字)时,程序包运行就没有问题。当我添加/适当地编码因子变量作为因子时,出现以下错误:

  

Error in Math.factor(cens) : ‘floor’ not meaningful for factors.

我尝试使用软件包默认值来确保我指定的内容都不引起问题。我尝试将所有变量编码为数字-这是不正确的。这消除了问题。我不知道为什么将四舍五入的底数应用于因子变量。我查看了软件包中运行的代码,无法确定问题出在哪里。

读入从Stata导出的csv文件中的数据集

returners<-read.csv("2019April11_RSF.csv")

种植具有1000棵树的随机生存森林,指示时间和结果变量

rsfr.obj <- rfsrc(Surv(days_return_or_censor, returner_SC) ~ ., returners,
      ntree = 1000)

打印并绘制增长对象

print(rsfr.obj)

我希望错误率和可变重要性估计能够打印出来。相反,我得到了错误:

  

Error in Math.factor(cens) : ‘floor’ not meaningful for factors

1 个答案:

答案 0 :(得分:0)

您的状态指示器应为数字/虚拟格式(即0 =左删,1 =事件) 希望对您有帮助

MD