Question

我在这里制作了一些纵向数据。可变结果是患者的生物标志物水平。可变访问代表访问标签。可变时间是指从基线t1开始的天数。有两种响应状态，“是”和“否”。我想知道的是，在时间过程中，响应者和非响应者之间的生物标记物水平是否有任何差异。

我使用线性混合模型进行分析。

#generate data    
df = data.frame(result = rnorm(200)+2, 
            visit = rep(c('t1', 't2', 't3', 't4', 't5'), 40),
            time = rep(c(0, 8, 14, 30, 60), 40),
            response = rep(c('yes', 'no'), each=100),
            id = rep(1:40, each=5) ) 

# run lme model 
library(lme4)
library(lmerTest)
lmer(result~time*response+(1|id),data=df)
lmer(result~factor(visit)*response+(1|id), data=df)
lmer(result~factor(visit, ordered=TRUE)*response+(1|id), data=df)

我的问题是： 1.在此分析中，我应该使用时间（连续）还是访问（因子）？ 2.如果我使用访问（因子），是否应该订购或无序？在选择使用什么类型的时间变量（因子与连续）方面是否有任何准则？

非常感谢。

Answer 1

......我应该将访问时间视为连续变量还是因子？

因为我认为（正确吗？）想要在同一时间段观察具有相同的随机效应项的因素。但是，如果所有访问级别和visits同时下降，则与time的随机效果相同。它们不在你的例子中，虽然我认为它有问题，因为例如id = 2第一次访问t = 60

> df[df$id == 2, ]
       result visit time response id
5  1.84451763    t1   60       no  2
6  1.30286252    t2    0       no  2
7  0.40109211    t3    8       no  2
8 -0.01516773    t4   14       no  2

我猜替代方案类似于(time|id)，在这种情况下，每个人都有一个随机的时间斜率或(time|response)，在这种情况下，两个响应类别中的每一个都有一个随机斜率。这在你的申请中可能有意义吗？

纵向数据的线性混合模型：连续时间与无序因子对有序因子的时间

1 个答案: