我正在研究一系列纵向医疗记录中复发事件中的疾病风险。我的队列倾向于根据选择的药物类型产生非常强烈的选择偏见。
为了确定疾病风险,我使用时间相关的Cox模型,对年龄,性别以及在疾病复发期间是否服用特定药物进行建模。
我的Cox模型如下:
coxResults <- coxph(Surv(tstart, tstop, status) ~ drug + gender + age + cluster(id) + strata(event), method = "breslow", data="topiramataCoxModel")
和非常小的数据样本看起来像(我已经替换了'id',因为这是真实数据):
id tstart tstop status event gender patientIMD codetype age drug
1 A 0 173 1 1 1 <NA> m 18 0
2 A 173 3792 1 2 1 <NA> m 29 0
3 B 0 2529 1 1 2 <NA> m 50 0
4 C 0 2002 1 1 1 <NA> m 64 0
5 D 0 31 0 1 2 <NA> m 30 0
6 D 31 41 0 2 2 <NA> m 30 0
7 D 41 560 1 3 2 <NA> r 31 1
8 D 560 1834 1 4 2 <NA> m 34 1
9 D 1834 1841 0 5 2 <NA> m 35 1
10 D 1841 3653 1 6 2 <NA> r 40 1
11 E 0 4 0 1 1 <NA> m 29 0
12 E 4 5884 1 2 1 <NA> m 45 0
13 F 0 4479 1 1 1 4 m 69 0
14 G 0 5806 1 1 1 3 m 60 0
15 H 0 13 0 1 2 1 m 46 0
16 H 13 455 1 2 2 1 m 47 0
17 H 455 4196 1 3 2 1 m 57 0
事件列是疾病事件的累积计数,例如,患者D在其病史中有5种该特定疾病的计数。不幸的是,当我们查看服用某种药物是否会降低复发风险时,存在巨大的选择偏见:status = 1 =无复发,因为这两个事件超过了设定的时间阈值,status = 0 =周期性事件。
如果患者因多次反复的专业医疗就诊而服用某种药物,即您一直回去看医生,那么Cox模型将建议该药物增加疾病复发的风险。这是不对的,只是这种特殊药物仅适用于极端情况,而且您经常会受到观察。当您的队列中有轻微疾病发生与极端疾病发生的混合样本时,选择偏向会很差。
时间相关的间隙时间cox回归要求对事件进行分层。我想知道,在每个分层的组中使用该药物有多重要。我怎样才能做到这一点?
谢谢