我希望这个问题适合这里,因为它不仅涉及编码问题,而且还探讨了一些有关线性混合效应模型的理论问题。假设线性混合效应模型:
model1 <- lmer(RT ~ word_duration + RT_prev + trial + stem +
(1|Subject) + (1|Word), data = df_whole)
我可以计算其AIC得分并将其与其他模型进行比较。就我而言,我有另一个模型:
model2 <- lmer(RT ~ word_duration + RT_prev + trial + form +
(1|Subject) + (1|Word), data = df_subset)
我的model3
的预测是model1和model2 = min[model1, model2]
的预测的最小值。我想将model3
与model1
进行比较,例如,我可以使用均方误差(MSE)。但是,MSE并未考虑model3
是两个模型的组合,MSE的不同可能无法证明增加复杂性是合理的。那么我可以计算出将模型的复杂性考虑在内的度量值以比较模型吗?
注意:model1
受过所有数据的训练,model2
仅针对一个子集。这样做是因为我假设子集中的项目可能会以不同的方式处理。因此,对于某些项目stem
和其他form
是更好的预测指标(如文献所述)。