如何处理Cox PH,R 3.1.3幸存者中违反比例风险假设

时间:2015-06-25 09:37:13

标签: survival-analysis

我正在使用'survival'包和coxph在R中进行生存分析。我的目标是比较不同慢性疾病患者的生存率。我的数据结构如下:

id, time, event, disease, age.at.dx
1, 342, 0, A, 8247
2, 2684, 1, B, 3879
3, 7634, 1, A, 3847

其中'时间'是从诊断到事件的天数,如果受试者死亡,'事件'为1,如果被审查则为0,'疾病'是8级的因素,'age.at.dx'是首次诊断受试者的天数。我是新手使用生存分析。查看这样的模型的cox.zph输出:

combi.age<-coxph(Surv(time,event)~disease+age.at.dx,data=combi)

两种疾病水平违反PH假设,p值<0.05。随着时间的推移绘制Schoenfeld残差表明,对于一种疾病,危害随着时间的推移而稳定下降,而对于第二种疾病,该线主要是平行的,但在图的最左侧有一个小的上升。

我的问题是如何处理这些疾病水平?从我的阅读中我知道,我应该尝试为疾病增加一个时间互动,其危险性会逐渐下降,但我不确定如何做到这一点,因为coxph的大多数例子我只是遇到过比较两组,而我比较8.另外,我能否安全地忽略疾病水平的假设违规,并且在早期时间点具有高危险性?

我想知道这是否是一种不合适的方式来构建我的数据,因为它并不排除一个人在数据中出现多次 - 这是一个问题吗?

感谢您的帮助,如果需要更多信息来回答这些问题,请与我们联系。

1 个答案:

答案 0 :(得分:2)

我说你已经对数据有了相当好的理解,并且应该提供你所发现的数据。这听起来像是一个描述性的研究,而不是一个你将向FDA提出要求尊重你的p值的研究。由于您的观众将(或应该)期望不同疾病的风险时间过程是异质的,我认为您可以描述这些结果并谈论为什么第一个“不守规矩”的生物/医学原因随着时间的推移疾病变得不那么重要,而其他不合格的疾病可能会随着时间的推移变得更加有效。您已经完成了比医学文献展览中大多数描述性文章更全面的分析。我很少看到非比例性的描述。

关于数据的最后一个问题“并不排除单个人在数据中出现多次”可能需要进行更深入的讨论。第一种方法是使用cluster() - 函数对患者ID进行分层。