(准) - 根据逻辑GLMM中的随机效应完全分离

时间:2015-01-07 09:48:26

标签: r logistic-regression lme4 mixed-models

在使用lme4拟合二元逻辑GLMM模型时,我遇到了收敛警告和非常大的组方差。我想知道这是否与根据随机效应的(准)完全分离有关,即许多个体(随机效应/分组变量)在因变量中只有0导致个体变异内的低?如果这可能是一个问题,是否有其他建模策略来处理这种情况?

更准确地说,我正在研究在特定年龄观察某个人(在父母离开时生孩子)的可能性。换句话说,我对每个人(通常是50个)进行了几次观察,指出个体是否在给定年龄的这种状态下被观察到。这是一个例子:

id  age status
 1   21      0
 1   22      0
 1   23      0
 1   24      1
 1   25      0
 1   26      1
 1   27      0
 ...

观察状态为1的机会非常低(根据病例而在1%到5%之间)并且我有很多观察结果(150'000观察结果和3'000个人)。

使用glmer指定ID(个体)作为随机效应并包括一些解释性因素(年龄类别,父母教育和观察状态的时间段)来拟合模型。我得到以下收敛警告(使用nAGQ=0时除外)和非常大的组差异(此处超过25)。

"Model failed to converge with max|grad| = 2.21808 (tol = 0.001, component 2)"
"Model is nearly unidentifiable: very large eigenvalue\n - Rescale variables?"

这是获得的模型。

    AIC      BIC   logLik deviance df.resid
  9625.0   9724.3  -4802.5   9605.0   151215

Scaled residuals:
   Min     1Q Median     3Q    Max
-2.529 -0.003 -0.002 -0.001 47.081

Random effects:
 Groups Name        Variance Std.Dev.
 id     (Intercept) 28.94    5.38
Number of obs: 151225, groups:  id, 3067

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)
(Intercept)    -10.603822   0.496392 -21.362  < 2e-16 ***
agecat[18,21)   -0.413018   0.075119  -5.498 3.84e-08 ***
agecat[21,24)   -1.460205   0.095315 -15.320  < 2e-16 ***
agecat[24,27)   -2.844713   0.137484 -20.691  < 2e-16 ***
agecat[27,30)   -3.837227   0.199644 -19.220  < 2e-16 ***
parent_educ     -0.007390   0.003609  -2.048   0.0406 *
period_cat80 s   0.126521   0.113044   1.119   0.2630
period_cat90 s  -0.105139   0.176732  -0.595   0.5519
period_cat00 s  -0.507052   0.263580  -1.924   0.0544 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
            (Intr) a[18,2 a[21,2 a[24,2 a[27,3 prnt_d pr_80' pr_90'
agct[18,21) -0.038
agct[21,24) -0.006  0.521
agct[24,27)  0.006  0.412  0.475
agct[27,30)  0.011  0.325  0.393  0.378
parent_educ -0.557  0.059  0.087  0.084  0.078
perd_ct80 s -0.075 -0.258 -0.372 -0.380 -0.352 -0.104
perd_ct90 s -0.048 -0.302 -0.463 -0.471 -0.448 -0.151  0.732
perd_ct00 s -0.019 -0.293 -0.459 -0.434 -0.404 -0.138  0.559  0.739

1 个答案:

答案 0 :(得分:1)

您可以尝试通过nloptroptimx软件包提供的一些不同的优化器之一。甚至还有一个allFit函数可以通过afex包为您尝试它们(只需查看allFit帮助文件)。 e.g:

all_mod <- allFit(exist_model)

这会让您检查估算的稳定程度。 This指向渐变主题的更多资源。

如果您担心完全分离,请参阅here了解Ben Bolker的答案,以使用blme包中的bglmer功能。它的运行方式与glmer非常相似,但允许您在模型规范中添加先验。