我的数据具有以下结构:
data <- data.frame(student_id = c(1, rep(2, 3), rep(3, 2)),
staff_id = c("a", "a", "b", "c", "b", "d"),
score = c(20, 15, 15, 15, 12, 12),
trt = c(1, 1, 1, 0, 1, 0))
> data
student_id staff_id score trt
1 1 a 20 1
2 2 a 15 1
3 2 b 15 1
4 2 c 15 0
5 3 b 12 1
6 3 d 12 0
数据使学生在评估中的student_id
,分数score
与一个或多个员工staff_id
相关联,并且每个staff_id
仅与单一治疗trt
(0或1)相关联。
我想控制staff_id
,并想知道trt
是否对学生在评估中的得分有影响,以及员工是否存在可变性(例如某些员工得分更高,得分更低)。我想知道以下模型是否合适:
mod0 <- lmer(score ~ trt + (1 | staff_id), data = data)
我怀疑这是否合适,因为对于每个员工,给定的学生没有唯一的分数,而是相同的分数。在我的实际数据中(如示例所示),学生与教职员工的交流虽然很少,但很少。
对我来说,一种可能性是仅使用与单个student_id
关联的staff_id
,但这将涉及丢弃大量数据。
此外,为简单起见,我可以假设与student_id
中的staff_id
相关的任何trt
都在处理中。
任何想法都会受到欢迎!