我想知道使用固定和随机因素是否可以接受。我的理解是,这不是一般做法。
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3881361/
http://avesbiodiv.mncn.csic.es/estadistica/curso2011/regm26.pdf
在下面的模型中,我使用Sp
作为固定因素和随机因子,我的模型不会收敛。
Model1 <- lmer (C1 ~ Place*Voicing*Length*Sp +
(1+Place+Voicing+Length|Sp),data =
C1,control=lmerControl(optCtrl=list(maxfun=50000)))
anova (Model1)
str(LME_Model1)
$ Sp : Factor w/ 5 levels
$ Place : Factor w/ 3 levels
$ Voicing : Factor w/ 2 levels
$ Length : Factor w/ 2 levels
Warning messages:
1: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, :
unable to evaluate scaled gradient
2: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, :
Model failed to converge: degenerate Hessian with 4 negative eigenvalues
如果我从固定因子中排除Sp
,那么模型会收敛。
有人可以解释是否可以将Sp
用作固定因子吗?
答案 0 :(得分:1)
你想要拟合的模型理论上可以,但实际上很难。
更确切地说,当你说“包括固定和随机的因素”时,你的意思是“包括固定因子和*作为特定分组变量中的术语”。我通常将“包含g
作为随机效果”解释为“包含g
作为随机效果分组变量”,即类似(1|g)
的内容。
当您在模型中加入(1+Place+Voicing+Length|Sp)
时,您所假设的是Place
,Voicing
和Length
的效果可以在不同级别之间变化分组变量(Sp
)。鉴于您使用的是randomized block design(Sp
的每个或至少大多数级别都对Place
,Voicing
的所有或大部分级别进行了观察,和Length
),这种可变性理论上可估计。
然而......如果你想估计所有这些变化,你通常需要一个大实验。假设Place
,Voicing
和Length
分别具有m1
,m2
和m3
级别。 lme4
假定特定分组变量包含的所有术语都可以变为共存;这意味着您将使用1+m1+m2+m3-3 = m1+m2+m3-2
行和列来估计方差 - 协方差矩阵(不同的效果共享截距项),或总共(m1+m2+m3-2)*(m1+m2+m3-1)/2
方差 - 协方差参数 - 至少10 ,如果这些是两个层面的因素。
当混合模型在理论上可识别时,关于正确程序存在很多争论,但实际上没有足够的数据来适应最大模型。一些讨论是here。你可以适应最大模型,并以某种合理的顺序抛弃术语,直到它不再被指定为止;使用贝叶斯方法,指定先验来规范模型;尝试在更简单的模型上决定先验 ......