我知道随机效应和平滑曲线估计之间存在二元性。 At this link,Simon Wood描述了如何使用mgcv指定随机效应。特别值得注意的是以下段落:
例如,如果g是一个因子,则s(g,bs =" re")为每个g级产生一个随机系数,其中的无线电系数全部建模为i.i.d.正常。
经过快速模拟后,我可以看到这是正确的,并且模型拟合几乎相同。然而,自由的可能性和程度非常不同。有人可以解释这个区别吗?哪一个应该用于测试?
library(mgcv)
library(lme4)
set.seed(1)
x <- rnorm(1000)
ID <- rep(1:200,each=5)
y <- x
for(i in 1:200) y[which(ID==i)] <- y[which(ID==i)] + rnorm(1)
y <- y + rnorm(1000)
ID <- as.factor(ID)
# gam (mgcv)
m <- gam(y ~ x + s(ID,bs="re"))
gam.vcomp(m)
coef(m)[1:2]
logLik(m)
# lmer
m2 <- lmer(y ~ x + (1|ID))
sqrt(VarCorr(m2)$ID[1])
summary(m2)$coef[,1]
logLik(m2)
mean( abs( fitted(m)-fitted(m2) ) )
完全披露:我遇到了这个问题,因为我想要适应包含随机效应(重复测量)的GAM,但需要知道我是否可以信任这些模型下基于可能性的测试。