Question

我的数据具有以下结构：

data <- data.frame(student_id = c(1, rep(2, 3), rep(3, 2)),
               staff_id = c("a", "a", "b", "c", "b", "d"),
               score = c(20, 15, 15, 15, 12, 12),
               trt = c(1, 1, 1, 0, 1, 0))

> data
  student_id staff_id score trt
1          1        a    20   1
2          2        a    15   1
3          2        b    15   1
4          2        c    15   0 
5          3        b    12   1
6          3        d    12   0

数据使学生在评估中的student_id，分数score与一个或多个员工staff_id相关联，并且每个staff_id仅与单一治疗trt（0或1）相关联。

我想控制staff_id，并想知道trt是否对学生在评估中的得分有影响，以及员工是否存在可变性（例如某些员工得分更高，得分更低）。我想知道以下模型是否合适：

mod0 <- lmer(score ~ trt + (1 | staff_id), data = data)

我怀疑这是否合适，因为对于每个员工，给定的学生没有唯一的分数，而是相同的分数。在我的实际数据中（如示例所示），学生与教职员工的交流虽然很少，但很少。

对我来说，一种可能性是仅使用与单个student_id关联的staff_id，但这将涉及丢弃大量数据。

此外，为简单起见，我可以假设与student_id中的staff_id相关的任何trt都在处理中。

任何想法都会受到欢迎！

在lme4中指定部分交叉的模型

0 个答案: