我的数据集有时仅包含特定变量的缺失值。如果没有进一步说明,则将删除整个观察结果。如何仅忽略此特定缺失值? 例如,如果观察值5在v2处有缺失值,我只想跳过此单个缺失值,而不忽略整个观察值。
我是R的新手,到目前为止,我了解到可以在计算平均值时使用na.rm
或忽略整个行的na.omit
。但是,na.omit
背后的逻辑正是我不想使用的逻辑,但这就是R在默认情况下似乎正在做的事情。
cox_prop <- coxph(Surv(Duration, status) ~ v1+ v2+ v3+ v4+ v5+ v6 + v7+ v8+ v9, data = mydata)
n = 439,事件数= 316 (由于缺少缺失,删除了201个观测值)
您可以看到一半的数据被删除,这使我的结果变得毫无用处。我可以使用na.action
参数吗? (老实说,我不明白它的作用。)