Question

我想知道使用固定和随机因素是否可以接受。我的理解是，这不是一般做法。

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3881361/

http://avesbiodiv.mncn.csic.es/estadistica/curso2011/regm26.pdf

在下面的模型中，我使用Sp作为固定因素和随机因子，我的模型不会收敛。

Model1 <- lmer (C1 ~ Place*Voicing*Length*Sp + 
     (1+Place+Voicing+Length|Sp),data = 
C1,control=lmerControl(optCtrl=list(maxfun=50000)))
anova (Model1)

str(LME_Model1)

$ Sp      : Factor w/ 5 levels
$ Place   : Factor w/ 3 levels
$ Voicing : Factor w/ 2 levels
$ Length  : Factor w/ 2 levels

Warning messages:
1: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
unable to evaluate scaled gradient
2: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
Model failed to converge: degenerate  Hessian with 4 negative eigenvalues

如果我从固定因子中排除Sp，那么模型会收敛。有人可以解释是否可以将Sp用作固定因子吗？

Answer 1

你想要拟合的模型理论上可以，但实际上很难。

更确切地说，当你说“包括固定和随机的因素”时，你的意思是“包括固定因子和*作为特定分组变量中的术语”。我通常将“包含g作为随机效果”解释为“包含g作为随机效果分组变量”，即类似(1|g)的内容。

当您在模型中加入(1+Place+Voicing+Length|Sp)时，您所假设的是Place，Voicing和Length的效果可以在不同级别之间变化分组变量（Sp）。鉴于您使用的是randomized block design（Sp的每个或至少大多数级别都对Place，Voicing的所有或大部分级别进行了观察，和Length），这种可变性理论上可估计。

然而......如果你想估计所有这些变化，你通常需要一个大实验。假设Place，Voicing和Length分别具有m1，m2和m3级别。 lme4假定特定分组变量包含的所有术语都可以变为共存;这意味着您将使用1+m1+m2+m3-3 = m1+m2+m3-2行和列来估计方差 - 协方差矩阵（不同的效果共享截距项），或总共(m1+m2+m3-2)*(m1+m2+m3-1)/2方差 - 协方差参数 - 至少10 ，如果这些是两个层面的因素。

当混合模型在理论上可识别时，关于正确程序存在很多争论，但实际上没有足够的数据来适应最大模型。一些讨论是here。你可以适应最大模型，并以某种合理的顺序抛弃术语，直到它不再被指定为止;使用贝叶斯方法，指定先验来规范模型;尝试在更简单的模型上决定先验 ......

在线性混合模型中使用固定和随机因子

1 个答案: