我目前正在使用线性混合模型(LMM),并且想要执行一些残差分析。由于线性混合模型的残差“相关且不一定具有恒定方差”,因此它们不足以检查模型基础的假设(Fitzmaurice等,2011,第266页)。因此,有人建议(Waternaux等人,1989年)使用Cholesky变换残差来研究模型假设,另请参阅Houseman等人(1989年)。 (2004)和Santos Nobre和da Motta Singer(2007)。
也就是说,假设我们有一个LMM,其形式为Y i = X i β+ Z i b i < / sub> +Ɛ i ,其中β是固定效应参数的向量,b i 是正态分布随机效应的向量,而X i < / sub>和Z i 是设计矩阵。
然后,残差e i = Y i -X i β相关,使用估计的β系数观察到的残差也相关而不是未知的真实值。我们将这些残差表示为r i 。通过找到r i 的协方差矩阵的Cholesky分解,对残差进行解相关。也就是说,令Cov(e i )=Σ i ,令L i i '为Cholesky分解r i 估计∑ i 的估计。然后将Cholesky变换的残差定义为r * i = L i -1 r i 。这些是我试图从lme4(Bates等人,2015年)软件包中获得的残差,但到目前为止还没有成功。
但是,使用Fitzmaurice等人首页的数据。 (2011),我设法使用nlme软件包(而不是lme4软件包)从书中的案例研究中重新创建了残差。代码在下面提供。
require(foreign) # To read dta-files
require(nlme) # The nlme package used to estimate the LMM.
require(mgcv) # Needed for the extract.lme.cov function
fat <- read.dta("https://content.sph.harvard.edu/fitzmaur/ala2e/fat.dta") # We read the data
# Add spline function for time, with a knot at age of menarch, denoted time = 0 in the data.
fat$timeknot <- fat$time * (fat$time > 0)
# Estimate the LMM with nlme
nlme.model <- lme(pbf ~ time + timeknot, data=fat, random = ~ 1 + time + timeknot | id)
# Calculate the residuals
raw.residuals <- residuals(nlme.model, level=0)
# Cholesky residuals
est.cov <- extract.lme.cov(nlme.model, fat) # We extract the blocked covariance function of the residuals
Li <- t(chol(est.cov)) # We find the Cholesky transformation of the residuals. (The transform is to get the lower trangular matrix.)
cholesky.residuals <- solve(Li) %*% raw.residuals # We then calculate the transformed residuals.
hist(cholesky.residuals) # We plot the residuals
因此,我的问题是,有没有一种简单的方法可以使用lme4包提取残差的估计协方差矩阵?还是直接获得Cholesky变换残差?
感谢您的帮助或指示。问候,
/菲尔
参考:
Bates,D.,Mächler,M.,Bolker,B.,&Walker,S.(2015年)。使用lme4拟合线性混合效果模型。 Journal of Statistics Software(统计软件杂志),67(1),1-48。
Fitzmaurice,G.M.,Laird,N.M.,&Ware,J.H.(2011年)。 应用纵向分析,第二版。约翰·威利父子。
Houseman,E. A.,Ryan,L.M.,&Coull,B.A.(2004年)。用于评估具有相关结果的线性模型中的正常错误的Cholesky残差。 《美国统计协会杂志》 n,99(466),383-394。
Santos Nobre,J.和da Motta Singer,J.(2007)。线性混合模型的残差分析。生物识别杂志:生物科学数学方法杂志,49(6),863-875。
Waternaux,C.,Laird,N.M。,和Ware,J.H。(1989)。纵向数据分析的方法:血铅浓度和认知发育。 《美国统计协会杂志》 ,84(405),33-41。
答案 0 :(得分:0)
经过大量的挖掘,我发现该问题的答案已发布在该网站的其他位置,并且在发布我自己的帖子之前找不到该帖子。 (尽管我搜索过!)
解决方案可以在这里找到: Get Residual Variance-Covariance Matrix in lme4