我正在使用randomForestSRC来评估34种潜在生存预测因素的可变重要性。当所有潜在的预测变量都是数字(或编码为数字)时,程序包运行就没有问题。当我添加/适当地编码因子变量作为因子时,出现以下错误:
Error in Math.factor(cens) : ‘floor’ not meaningful for factors.
我尝试使用软件包默认值来确保我指定的内容都不引起问题。我尝试将所有变量编码为数字-这是不正确的。这消除了问题。我不知道为什么将四舍五入的底数应用于因子变量。我查看了软件包中运行的代码,无法确定问题出在哪里。
returners<-read.csv("2019April11_RSF.csv")
rsfr.obj <- rfsrc(Surv(days_return_or_censor, returner_SC) ~ ., returners,
ntree = 1000)
print(rsfr.obj)
我希望错误率和可变重要性估计能够打印出来。相反,我得到了错误:
Error in Math.factor(cens) : ‘floor’ not meaningful for factors
答案 0 :(得分:0)
您的状态指示器应为数字/虚拟格式(即0 =左删,1 =事件) 希望对您有帮助
MD