纵向数据的线性混合模型:连续时间与无序因子对有序因子的时间

时间:2017-12-01 06:11:06

标签: r regression lme4 longitudinal

我在这里制作了一些纵向数据。可变结果是患者的生物标志物水平。可变访问代表访问标签。可变时间是指从基线t1开始的天数。有两种响应状态,“是”和“否”。我想知道的是,在时间过程中,响应者和非响应者之间的生物标记物水平是否有任何差异。

我使用线性混合模型进行分析。

#generate data    
df = data.frame(result = rnorm(200)+2, 
            visit = rep(c('t1', 't2', 't3', 't4', 't5'), 40),
            time = rep(c(0, 8, 14, 30, 60), 40),
            response = rep(c('yes', 'no'), each=100),
            id = rep(1:40, each=5) ) 

# run lme model 
library(lme4)
library(lmerTest)
lmer(result~time*response+(1|id),data=df)
lmer(result~factor(visit)*response+(1|id), data=df)
lmer(result~factor(visit, ordered=TRUE)*response+(1|id), data=df)

我的问题是: 1.在此分析中,我应该使用时间(连续)还是访问(因子)? 2.如果我使用访问(因子),是否应该订购或无序? 在选择使用什么类型的时间变量(因子与连续)方面是否有任何准则?

非常感谢。

1 个答案:

答案 0 :(得分:0)

  

......我应该将访问时间视为连续变量还是因子?

因为我认为(正确吗?)想要在同一时间段观察具有相同的随机效应项的因素。但是,如果所有访问级别和visits同时下降,则与time的随机效果相同。它们不在你的例子中,虽然我认为它有问题,因为例如id = 2第一次访问t = 60

> df[df$id == 2, ]
       result visit time response id
5  1.84451763    t1   60       no  2
6  1.30286252    t2    0       no  2
7  0.40109211    t3    8       no  2
8 -0.01516773    t4   14       no  2

我猜替代方案类似于(time|id),在这种情况下,每个人都有一个随机的时间斜率或(time|response),在这种情况下,两个响应类别中的每一个都有一个随机斜率。这在你的申请中可能有意义吗?