如何使用R生成具有时间相关协变量的生存数据

时间:2014-07-23 15:16:54

标签: r simulation survival-analysis data-generation

我想从包含时间依赖性协变量的Cox比例风险模型中生成生存时间。该模型是

h(t|Xi) =h_0(t) exp(gamma*Xi + alpha*mi(t))

Xi生成Binomial(1,0.5)mi(t)生成time-dependent covariate

对于与时间无关的协变量,我生成如下

#For time independent case
# h_0(t) = 1
gamma <- -1
u <- runif(n=100,min=0,max=1)
Xi <- rbinom(n=100,size=1,prob=0.5)
T <- -log(u)/exp(gamma*Xi)

任何人都可以帮我生成具有时变协变量的生存数据。

1 个答案:

答案 0 :(得分:0)

通过在协变量变化时检查观察并在时间0或检查时重新进入群组,将时间相关协变量输入Cox模型。因此,协变量矩阵以间隔生成,并且针对非事件多次合并,并且基于事件观察的前/后时段针对事件多次合并。您可以在事件后删除协变量修改。 Cox模型不处理协变量值和失败的并发变化,因此我们必须排除这种可能性。

为了模拟生存结果,您可以生成协变量值和切换点。然后根据基线协变量值模拟生存结果。如果第一个协变量变化时间超过失败时间,则保持失败时间并且该参与者没有协变量变化,否则在该失败时间检查观察并在新的协变量值的检查时间将它们重新输入到群组中。模拟第二个协变量值变化(如果存在)和第二个可能的失败时间,迭代地评估它们,并且只在失败时间在协变量变化值之前结束。

解决这个问题,有人可能会提供比我更有效的代码,但一个简单的方法是使用递归。我将暂时假设存在一个恒定的基线危险函数(指数生存),但是根据任意基线危险函数模拟生存结果的原则已在别处描述,我将其留给您。为简单起见,我还假设m是二进制的。再次,这是你结束的基础。

sim <- function(id=1:100, t0= rep(0, 100), m0=rep(0, 100), bfail=c(0,0), rchange=1) {
  tfail <- rexp(length(id), exp(bfail[1] + bfail[2]*m0))
  tchange <- rexp(length(id), rchange)
  tevent <- pmin(tfail, tchange)
  fevent <- tfail == tevent
  if (all(fevent))
    return(list(cbind('start'=t0, 'stop'=t0+tevent, 'event'=fevent, 'id'=id, 'm'=m0)))
  c(
    list(cbind('start'=t0, 'stop'=t0+tevent, 'event'=fevent, 'id'=id, 'm'=m0)), 
    sim(id = id[!fevent], t0=(t0+tevent)[!fevent], m0=1-m0[!fevent], bfail, rchange)
  )

}

可以使用以下命令运行示例:

set.seed(123)
times <- sim(id=1:1000, t0= rep(0, 1000), m0=rep(0, 1000), bfail=c(-1, -2), rchange=0.4)
times <- as.data.frame(do.call(rbind, times))
coxph(Surv(start, stop, event) ~ m, data=times)

提供以下输出:

> coxph(Surv(start, stop, event) ~ m, data=times)
Call:
coxph(formula = Surv(start, stop, event) ~ m, data = times)

    coef exp(coef) se(coef)     z      p
m -1.917     0.147    0.100 -19.1 <2e-16

Likelihood ratio test=533  on 1 df, p=0
n= 2852, number of events= 1000 

将-1.917系数与-2指数生存结果的对数风险比进行比较。