了解Cox模型中缺失的原因

时间:2015-04-13 18:28:52

标签: r survival-analysis cox-regression

我运行了以下Cox模型并获得了1526679个已删除的观察结果,这是我数据的很大一部分。

Call: coxph(formula = Surv(time1sec, time2sec, event) ~ gain + 
Buy + Lev + TP + frailty(ID), data)

n= 73322, number of events= 73322 (1526679 observations deleted due to missingness)

我不确定为何删除了这些意见。我确信这些值是存在的,并不是空的。当我将ID添加为一个脆弱的术语时,这种情况就开始发生了。

任何想法可能会在这里发生什么?

2 个答案:

答案 0 :(得分:0)

在标准回归(和cox回归情况下的回归式)问题类型中,处理缺失值的默认方法只是忽略它们。对于您尝试预测的系数和值,都会出现这种情况。

我会先明确核实你想要的一切都在那里。这可以通过以下代码完成:

apply(data, 2, function(x) length(which(is.na(x))))

我还要验证我的Surv对象没有任何NA,使用以下代码:

length(which(is.na(Surv(time1sec, time2sec, event))))

答案 1 :(得分:0)

另外,请确保您的数据源仅包含相关信息。例如,我将我的数据文件导入到R中,其中包含许多对分析无用的条目(例如图例,关键字),R显然排除了这些结果,并显示为"缺失"