我在R中设置了一个扩展的Cox模型,其中包含一个与时间相关的协变量X1(X2-X7是时间独立的)
coxph(Surv(start, stop, status) ~ X1 + X2 + ... + X7, data = data).
为了将这个与时间相关的变量包含到模型中,我以“(开始,停止)样式”创建了数据集,该样式将最初的大约1500个观察值扩展到大约2500行。
subjid start stop status X1 X2 X3 X4 X5 X6 X7
1 0.000000 15.572895 1 0 Y Y Y Y 1 10
2 0.000000 4.501027 1 0 Y Y Y Y 1 15
3 0.000000 13.930185 0 0 Y Y N N 1 30
3 13.930185 17.117043 0 1 Y Y N N 1 12
3 17.117043 34.036961 0 0 Y Y N N 1 7
4 0.000000 26.381930 1 0 Y Y Y Y 0 3
5 0.000000 5.880903 0 0 Y N N N 1 22
5 5.880903 9.067762 0 1 Y N N N 1 1
5 9.067762 12.188912 1 0 Y N N N 1 11
6 0.000000 16.164271 1 0 Y N N Y 1 12
对于多达1300次观察,代码正确执行(即使我包含的代码超过1000,也需要很长时间)。包括更多观察结果会导致无响应的软件R(我正在等待大约5个小时的程序给我结果,但它仍然保持冻结状态)。 这与“关系”(http://stat.ethz.ch/R-manual/R-patched/library/survival/html/coxph.html)下的R coxph帮助网站上的声明一致。但是,我无法减少我的样本量(即我的数据集),因此我正在寻找其他建议如何使这段代码运行(更快)。
谢谢, 艾利