我要做的是在MICE的5个插补数据集上拟合5条Kaplan Meier曲线。我的目标是在每个时间点,取5个生存概率的平均值。我认为如果我有构成每条KM曲线的步长函数的确切形式,这将很容易,但我不知道如何提取它。
以下是我要运行的代码示例
#make up data
survival_time=rexp(10,3)
dead=sample(c(0,1),10,replace=TRUE)
gender=sample(c(0,1),10,replace=TRUE)
#induce missingness in gender
gender[3:5]=NA
data=cbind(survival_time,dead,gender)
#do imputation
imp=mice(data)
#fit KM curves on each of the imputed datasets
km_fit=with(imp,survfit(Surv(survival_time,dead)~gender))
#now break down each km curve into male and female
#and average the surv prob at each time
#but how?
挑战在于生存时间和死亡指标始终是固定的,但每个性别的数量在插补之间发生变化。因此,每组中的数字,以及事件的数量和时间在插补之间发生变化。
我的计划是什么,假设我可以获得步骤函数将是对步骤函数使用应用预测以获得方法。这是最好的解决方案,还是你认为会有更好的解决方案?
答案 0 :(得分:1)
要在评论中记录答案,可以使用带有summary (km_fit)
参数的times
解决此问题。