我正在尝试对重复测量实验中的数据进行建模,其中响应变量是bernoulli响应(即,0对1;错误与正确的响应)。我正在使用glmer
函数(R包lme4
)和family = binomial
来拟合逻辑模型,查看两个独立变量(即Trial_Type
和{{1} })影响在给定试验中提交错误的概率。这里的关键操作是一种特定的试验类型比其他试验类型更频繁地呈现。这是为了“引诱”参与者在其他试验中犯错误。
这就是数据的样子:
Block
这是模特:
'data.frame': 8212 obs. of 7 variables:
$ ID : Factor w/ 32 levels "data_1","data_10",..: 1 1 1 1 1 1 1 1 1 1 ...
$ Block : Factor w/ 2 levels "Block 1","Block 2": 1 1 1 1 1 1 1 1 1 1 ...
$ Trial : int 1 2 3 4 5 6 7 8 9 10 ...
$ Trial_Type : Factor w/ 4 levels "1","2","3",..: 1 1 1 1 2 1 1 3 1 1 ...
$ RT : int 336 430 430 309 253 386 275 339 368 469 ...
$ Reaction : Factor w/ 2 levels "Correct","Incorrect": 1 1 1 1 1 1 1 2 1 1 ...
$ Error_vs_Correct: num 1 1 1 1 1 1 1 0 1 1 ...
我的问题是 1)使用mod_bi_I <- glmer(Error_vs_Correct ~ Trial_Type + Block + Trial_Type:Block + (1|ID/Trial_Type),
family = binomial(link = 'logit'), data = all_data,
control = glmerControl(optimizer="bobyqa"))
car::Anova(mod_bi_I, type=3)
Analysis of Deviance Table (Type III Wald chisquare tests)
Response: Error_vs_Correct
Chisq Df Pr(>Chisq)
(Intercept) 404.2388 1 < 2e-16 ***
Trial_Type 103.7184 3 < 2e-16 ***
Block 0.0924 1 0.76111
Trial_Type:Block 6.6494 3 0.08395 .
方法时,数据的不平衡性是否会导致结果不准确?或 2)在试验类型和个人glmer
中嵌套观察是否能够很好地处理它。我读过(例如here)某种程度的“不平衡”不应该是一个问题,但我想知道多少是太多了。
以下是试验类型和回复的观察的交叉表:
(1|ID/Trial_Type)
评论将非常感谢!
编辑:我已经存储了数据集here的样本(准备进行分析),以防您想要重新创建模型。