我运行了以下Cox模型并获得了1526679个已删除的观察结果,这是我数据的很大一部分。
Call: coxph(formula = Surv(time1sec, time2sec, event) ~ gain +
Buy + Lev + TP + frailty(ID), data)
n= 73322, number of events= 73322 (1526679 observations deleted due to missingness)
我不确定为何删除了这些意见。我确信这些值是存在的,并不是空的。当我将ID添加为一个脆弱的术语时,这种情况就开始发生了。
任何想法可能会在这里发生什么?
答案 0 :(得分:0)
在标准回归(和cox回归情况下的回归式)问题类型中,处理缺失值的默认方法只是忽略它们。对于您尝试预测的系数和值,都会出现这种情况。
我会先明确核实你想要的一切都在那里。这可以通过以下代码完成:
apply(data, 2, function(x) length(which(is.na(x))))
我还要验证我的Surv对象没有任何NA,使用以下代码:
length(which(is.na(Surv(time1sec, time2sec, event))))
答案 1 :(得分:0)
另外,请确保您的数据源仅包含相关信息。例如,我将我的数据文件导入到R中,其中包含许多对分析无用的条目(例如图例,关键字),R显然排除了这些结果,并显示为"缺失"