在线性混合模型中使用固定和随机因子

时间:2018-04-15 19:41:54

标签: r random fixed lme4

我想知道使用固定和随机因素是否可以接受。我的理解是,这不是一般做法。

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3881361/

http://avesbiodiv.mncn.csic.es/estadistica/curso2011/regm26.pdf

在下面的模型中,我使用Sp作为固定因素和随机因子,我的模型不会收敛。

Model1 <- lmer (C1 ~ Place*Voicing*Length*Sp + 
     (1+Place+Voicing+Length|Sp),data = 
C1,control=lmerControl(optCtrl=list(maxfun=50000)))
anova (Model1)

str(LME_Model1)

$ Sp      : Factor w/ 5 levels
$ Place   : Factor w/ 3 levels
$ Voicing : Factor w/ 2 levels
$ Length  : Factor w/ 2 levels

Warning messages:
1: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
unable to evaluate scaled gradient
2: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
Model failed to converge: degenerate  Hessian with 4 negative eigenvalues

如果我从固定因子中排除Sp,那么模型会收敛。 有人可以解释是否可以将Sp用作固定因子吗?

1 个答案:

答案 0 :(得分:1)

你想要拟合的模型理论上可以,但实际上很难。

更确切地说,当你说“包括固定和随机的因素”时,你的意思是“包括固定因子和*作为特定分组变量中的术语”。我通常将“包含g作为随机效果”解释为“包含g作为随机效果分组变量”,即类似(1|g)的内容。

当您在模型中加入(1+Place+Voicing+Length|Sp)时,您所假设的是PlaceVoicingLength的效果可以在不同级别之间变化分组变量(Sp)。鉴于您使用的是randomized block designSp的每个或至少大多数级别都对PlaceVoicing的所有或大部分级别进行了观察,和Length),这种可变性理论上可估计。

然而......如果你想估计所有这些变化,你通常需要一个大实验。假设PlaceVoicingLength分别具有m1m2m3级别。 lme4假定特定分组变量包含的所有术语都可以变为共存;这意味着您将使用1+m1+m2+m3-3 = m1+m2+m3-2行和列来估计方差 - 协方差矩阵(不同的效果共享截距项),或总共(m1+m2+m3-2)*(m1+m2+m3-1)/2方差 - 协方差参数 - 至少10 ,如果这些是两个层面的因素。

当混合模型在理论上可识别时,关于正确程序存在很多争论,但实际上没有足够的数据来适应最大模型。一些讨论是here。你可以适应最大模型,并以某种合理的顺序抛弃术语,直到它不再被指定为止;使用贝叶斯方法,指定先验来规范模型;尝试在更简单的模型上决定先验 ......