比较lmList和lmer之间的系数

时间:2014-03-14 19:20:29

标签: r lme4

任何人都可以告诉我为什么斜率系数在从具有随机斜率的lmer模型中提取的斜率系数与来自符合相同数据集的lmList模型的斜率系数之间存在偏差?

...谢谢

2 个答案:

答案 0 :(得分:1)

经过一番挖掘后,我在Doug Bates的lme4书中找到了答案。释义...当主题水平的个体线性拟合较差时,线性混合效应模型系数倾向于向群体水平值(例如固定效应)展示所谓的“收缩”(见http://lme4.r-forge.r-project.org/lMMwR/lrgprt.pdf)。在这种情况下,站点级系数的不确定性很大(例如我们对其精确值的绝对估计值的信心很低),因此为了平衡数据的保真度,通过残差平方和测量,简单性在模型中,混合效应模型通过使预测更接近于一组共同的预测来平滑预测中的主体间差异,但不以牺牲显着增加残差平方和为代价。

答案 1 :(得分:1)

请注意,假设您的受试者(或观察单位)之间存在某种程度的相似性,“收缩”可能是一件好事,例如,如果您认为它们来自同一群体,因为它使模型对异常值更具鲁棒性在个人层面。

您可以通过计算混合效应模型和受试者内部拟合的总体确定系数来量化残差平方和的增加。我在这里为sleepstudy包中包含的lme4数据集执行此操作。

> library(lme4)
> mm <- lmer(Reaction ~ Days + (Days|Subject), data = sleepstudy) # mixef-effects
> ws <- lmList(Reaction ~ Days |Subject, data = sleepstudy) # within-subject
> 
> # coefficient of determination for mixed-effects model
> summary(lm(sleepstudy$Reaction ~ predict(mm)))$r.squared
[1] 0.8271702
> 
> # coefficient of determination for within subjects fit
> require(nlme)
> summary(lm(sleepstudy$Reaction ~ predict(ws)))$r.squared
[1] 0.8339452

您可以检查混合效应模型对于受试者内部拟合所解释的变异比例的下降是否非常小0.8339452 - 0.8271702 = 0.006775