我在这里制作了一些纵向数据。可变结果是患者的生物标志物水平。可变访问代表访问标签。可变时间是指从基线t1开始的天数。有两种响应状态,“是”和“否”。我想知道的是,在时间过程中,响应者和非响应者之间的生物标记物水平是否有任何差异。
我使用线性混合模型进行分析。
#generate data
df = data.frame(result = rnorm(200)+2,
visit = rep(c('t1', 't2', 't3', 't4', 't5'), 40),
time = rep(c(0, 8, 14, 30, 60), 40),
response = rep(c('yes', 'no'), each=100),
id = rep(1:40, each=5) )
# run lme model
library(lme4)
library(lmerTest)
lmer(result~time*response+(1|id),data=df)
lmer(result~factor(visit)*response+(1|id), data=df)
lmer(result~factor(visit, ordered=TRUE)*response+(1|id), data=df)
我的问题是: 1.在此分析中,我应该使用时间(连续)还是访问(因子)? 2.如果我使用访问(因子),是否应该订购或无序? 在选择使用什么类型的时间变量(因子与连续)方面是否有任何准则?
非常感谢。
答案 0 :(得分:0)
......我应该将访问时间视为连续变量还是因子?
因为我认为(正确吗?)想要在同一时间段观察具有相同的随机效应项的因素。但是,如果所有访问级别和visits
同时下降,则与time
的随机效果相同。它们不在你的例子中,虽然我认为它有问题,因为例如id = 2
第一次访问t = 60
> df[df$id == 2, ]
result visit time response id
5 1.84451763 t1 60 no 2
6 1.30286252 t2 0 no 2
7 0.40109211 t3 8 no 2
8 -0.01516773 t4 14 no 2
我猜替代方案类似于(time|id)
,在这种情况下,每个人都有一个随机的时间斜率或(time|response)
,在这种情况下,两个响应类别中的每一个都有一个随机斜率。这在你的申请中可能有意义吗?