如何减少(开始,停止)式生存数据的扩展Cox模型的计算时间

时间:2014-10-16 15:54:33

标签: r survival-analysis cox-regression

我在R中设置了一个扩展的Cox模型,其中包含一个与时间相关的协变量X1(X2-X7是时间独立的) coxph(Surv(start, stop, status) ~ X1 + X2 + ... + X7, data = data).

为了将这个与时间相关的变量包含到模型中,我以“(开始,停止)样式”创建了数据集,该样式将最初的大约1500个观察值扩展到大约2500行。

   subjid  start   stop  status  X1    X2     X3    X4       X5     X6   X7
       1  0.000000 15.572895      1  0     Y      Y     Y        Y      1    10
       2  0.000000  4.501027      1  0     Y      Y     Y        Y      1    15
       3  0.000000 13.930185      0  0     Y      Y     N        N      1    30
       3 13.930185 17.117043      0  1     Y      Y     N        N      1    12
       3 17.117043 34.036961      0  0     Y      Y     N        N      1    7
       4  0.000000 26.381930      1  0     Y      Y     Y        Y      0    3
       5  0.000000  5.880903      0  0     Y      N     N        N      1    22
       5  5.880903  9.067762      0  1     Y      N     N        N      1    1   
       5  9.067762 12.188912      1  0     Y      N     N        N      1    11 
       6  0.000000 16.164271      1  0     Y      N     N        Y      1    12

对于多达1300次观察,代码正确执行(即使我包含的代码超过1000,也需要很长时间)。包括更多观察结果会导致无响应的软件R(我正在等待大约5个小时的程序给我结果,但它仍然保持冻结状态)。 这与“关系”(http://stat.ethz.ch/R-manual/R-patched/library/survival/html/coxph.html)下的R coxph帮助网站上的声明一致。但是,我无法减少我的样本量(即我的数据集),因此我正在寻找其他建议如何使这段代码运行(更快)。

谢谢, 艾利

0 个答案:

没有答案