Kaplan-Meier曲线图与生成的统计数据不一致

时间:2018-08-10 07:29:40

标签: r survival-analysis

我正在为再入院数据绘制Kaplan-Meier(KM)曲线,该数据可从R封装的脆弱包装中获得。我使用了以下简单代码,按性别变量将曲线分层:

library(survival)
library(frailtypack)
data(readmission)
readmission
sobj<-Surv(readmission$time,readmission$event==1)
km.plot <- survfit(sobj ~readmission$sex, data = readmission)
km.plot
plot(km.plot,lty=c(1,2),lwd=2)
legend(x="bottomleft",lty=c(1,2),lwd=2, legend=c("Male","Female"))

数据是针对重复发生的事件(即受试者有多个失败时间)。 “ km.plot”的输出告诉我,男性和女性都有大量审查事件时间。在此之下,我期望KM曲线趋于平稳至非零的生存概率,但是女性的KM将变为零。当我仅在第一个事件时间生成情节而忽略后续事件时,仍然会得到此结果。

我认为我的代码可能出了些问题,但是很难弄清楚。非常感谢您对此提供的任何帮助

1 个答案:

答案 0 :(得分:1)

请勿在回归参数之外创建Surv对象,并且请勿使用列名称而不引用数据框。代码中违反这两种做法的行为将阻止“预测”和“绘图”方法使用模型对象中的term属性来知道从何处访问数据元素。

曲线形状的问题:如果最后一个事件是死亡,则K-M曲线将降至零。

请解释为什么您认为K-M曲线对“重复事件”有意义吗?