Question

我正在使用glmmTMB分析负二项式广义线性混合模型（GLMM），其中因变量是计数数据（CT），其分布过于分散。

相关数据框中有115个样本（行）。有两个固定效果（F1，F2）和随机截距（R），其中嵌套了另一个随机效果（NR）。还有一个偏移量，由每个样本中总计数的自然对数（LOG_TOT）组成。

数据帧df的示例是：

CT  F1  F2  R   NR  LOG_TOT
77  0   0   1   1   12.9
167 0   0   2   6   13.7
289 0   0   3   11  13.9
253 0   0   4   16  13.9
125 0   0   5   21  13.7
109 0   0   6   26  13.6
96  1   0   1   2   13.1
169 1   0   2   7   13.7
190 1   0   3   12  13.8
258 1   0   4   17  13.9
101 1   0   5   22  13.5
94  1   0   6   27  13.5
89  1   25  1   4   13.0
166 1   25  2   9   13.6
175 1   25  3   14  13.7
221 1   25  4   19  13.8
131 1   25  5   24  13.5
118 1   25  6   29  13.6
58  1   75  1   5   12.9
123 1   75  2   10  13.4
197 1   75  3   15  13.7
208 1   75  4   20  13.8
113 1   8   1   3   13.2
125 1   8   2   8   13.7
182 1   8   3   13  13.7
224 1   8   4   18  13.9
104 1   8   5   23  13.5
116 1   8   6   28  13.7
122 2   0   1   2   13.1
115 2   0   2   7   13.6
149 2   0   3   12  13.7
270 2   0   4   17  14.1
116 2   0   5   22  13.5
94  2   0   6   27  13.7
73  2   25  1   4   12.8
61  2   25  2   9   13.0
185 2   25  3   14  13.8
159 2   25  4   19  13.7
125 2   25  5   24  13.6
75  2   25  6   29  13.5
121 2   8   1   3   13.0
143 2   8   2   8   13.8
219 2   8   3   13  13.9
191 2   8   4   18  13.7
98  2   8   5   23  13.5
115 2   8   6   28  13.6
110 3   0   1   2   12.8
123 3   0   2   7   13.6
210 3   0   3   12  13.9
354 3   0   4   17  14.4
160 3   0   5   22  13.7
101 3   0   6   27  13.6
69  3   25  1   4   12.6
112 3   25  2   9   13.5
258 3   25  3   14  13.8
174 3   25  4   19  13.5
171 3   25  5   24  13.9
117 3   25  6   29  13.7
38  3   75  1   5   12.1
222 3   75  2   10  14.1
204 3   75  3   15  13.5
235 3   75  4   20  13.7
241 3   75  5   25  13.8
141 3   75  6   30  13.9
113 3   8   1   3   12.9
90  3   8   2   8   13.5
276 3   8   3   13  14.1
199 3   8   4   18  13.8
111 3   8   5   23  13.6
109 3   8   6   28  13.7
135 4   0   1   2   13.1
144 4   0   2   7   13.6
289 4   0   3   12  14.2
395 4   0   4   17  14.6
154 4   0   5   22  13.7
148 4   0   6   27  13.8
58  4   25  1   4   12.8
136 4   25  2   9   13.8
288 4   25  3   14  14.0
113 4   25  4   19  13.5
162 4   25  5   24  13.7
172 4   25  6   29  14.1
2   4   75  1   5   12.3
246 4   75  3   15  13.7
247 4   75  4   20  13.9
114 4   8   1   3   13.1
107 4   8   2   8   13.6
209 4   8   3   13  14.0
190 4   8   4   18  13.9
127 4   8   5   23  13.5
101 4   8   6   28  13.7
167 6   0   1   2   13.4
131 6   0   2   7   13.5
369 6   0   3   12  14.5
434 6   0   4   17  14.9
172 6   0   5   22  13.8
126 6   0   6   27  13.8
90  6   25  1   4   13.1
172 6   25  2   9   13.7
330 6   25  3   14  14.2
131 6   25  4   19  13.7
151 6   25  5   24  13.9
141 6   25  6   29  14.2
7   6   75  1   5   12.2
194 6   75  2   10  14.2
280 6   75  3   15  13.7
253 6   75  4   20  13.8
45  6   75  5   25  13.4
155 6   75  6   30  13.9
208 6   8   1   3   13.5
97  6   8   2   8   13.5
325 6   8   3   13  14.3
235 6   8   4   18  14.1
112 6   8   5   23  13.6
188 6   8   6   28  14.1

将随机和嵌套随机效应视为因素。固定效果F1的值为0、1、2、3、4和6。固定效果F2的值为0、8、25和75。我将固定效果视为连续的，而不是有序的，因为我会希望识别因变量CT中的单调单向变化，而不是向上和向下变化。

我以前使用lme4软件包将数据分析为混合模型：

library(lme4)

m1 <- lmer(CT ~ F1*F2 + (1|R/NR) +
offset(LOG_TOT), data = df, verbose=FALSE)

随后在multcomp软件包中使用glht进行了事后分析，采用了公式方法：

library(multcomp)

glht_fixed1 <- glht(m1, linfct = c(
"F1 == 0",
"F1 + 8*F1:F2 == 0",
"F1 + 25*F1:F2 == 0",
"F1 + 75*F1:F2 == 0",
"F1 + (27)*F1:F2 == 0"))

glht_fixed2 <- glht(m1, linfct = c(
"F2 + 1*F1:F2 == 0",
"F2 + 2*F1:F2 == 0",
"F2 + 3*F1:F2 == 0",
"F2 + 4*F1:F2 == 0",
"F2 + 6*F1:F2 == 0",
"F2 + (3.2)*F1:F2 == 0"))

glht_omni <- glht(m1)

这里是对应的负二项式glmmTMB模型，我现在更喜欢：

library(glmmTMB)

m2 <- glmmTMB(CT ~ F1*F2 + (1|R/NR) + 
offset(LOG_TOT), data = df, verbose=FALSE, family="nbinom2")

根据Ben Bolker（https://stat.ethz.ch/pipermail/r-sig-mixed-models/2017q3/025813.html）的建议，使用glmmTMB进行事后测试的最佳方法是使用lsmeans（或更新的emmeans）。

我拒绝了Ben的建议，正在跑步

source(system.file("other_methods","lsmeans_methods.R",package="glmmTMB"))

然后我可以在glmmTMB对象上使用emmeans。例如，

as.glht(emmeans(m2,~(F1 + 27*F1:F2)))

General Linear Hypotheses

Linear Hypotheses:
Estimate
3.11304347826087, 21 == 0 -8.813

但这似乎不正确。我还可以将F1和F2更改为系数，然后尝试以下操作：

as.glht(emmeans(m2,~(week + 27*week:conc)))

     General Linear Hypotheses

Linear Hypotheses:
           Estimate
0, 0 == 0    -6.721
1, 0 == 0    -6.621
2, 0 == 0    -6.342
3, 0 == 0    -6.740
4, 0 == 0    -6.474
6, 0 == 0    -6.967
0, 8 == 0    -6.694
1, 8 == 0    -6.651
2, 8 == 0    -6.227
3, 8 == 0    -6.812
4, 8 == 0    -6.371
6, 8 == 0    -6.920
0, 25 == 0   -6.653
1, 25 == 0   -6.648
2, 25 == 0   -6.282
3, 25 == 0   -6.766
4, 25 == 0   -6.338
6, 25 == 0   -6.702
0, 75 == 0   -6.470
1, 75 == 0   -6.642
2, 75 == 0   -6.091
3, 75 == 0   -6.531
4, 75 == 0   -5.762
6, 75 == 0   -6.612

但是，我再次不确定如何根据我的意愿弯曲此输出。如果有人可以告诉我如何使用glmmTMB正确地将glht和linfct中的公式的使用转移到emmeans场景中，我将不胜感激。我已经阅读了所有手册和小插曲，直到脸色发青（或者至少是那种感觉），但我仍然茫然。在辩护中（可追溯性？），我是一个统计专家，如果我在这里问一个非常明显的答案的问题，那么抱歉。

glht软件和事后测试直接转移到glmmADMB软件包中，但是glmmADMB的速度比glmmTMB慢10倍。我需要多次运行此分析，每个运行都有300,000个负二项式混合模型示例，因此速度至关重要。

非常感谢您的建议和帮助！

Answer 1

specs的第二个参数（emmeans）与linfct中的glht参数相同，因此您不能以相同的方式使用它。您必须按预期方式使用它来调用emmeans()。 as.glht()函数将结果转换为glht对象，但实际上没有必要这样做，因为emmeans摘要会产生相似的结果。

我认为您尝试获得的结果可以通过

获得

emmeans(m2, ~ F2, at = list(F2 = c(0, 8, 25, 75)))

（使用具有预测变量的原始模型作为定量变量）。这样将计算出调整后的均值保持F1的平均值和F2的每个指定值。

请查看emmeans()的文档。此外，还有许多小插图提供解释和示例-从https://cran.r-project.org/web/packages/emmeans/vignettes/basics.html开始。

Answer 2

根据我出色的统计顾问的建议，我认为以下解决方案提供了我以前使用glht和linfct获得的解决方案。

F1的斜率是通过使用对比度和em来计算F1的两个斜率（以c（0,1）表示），从而计算出F1的各个斜率。（由于回归是线性的，因此F1的两个值是任意的，只要它们以一个单位分隔，例如c（3,4））。反之亦然。

因此，F1在F2处的斜率= 0、8、25、75和27（27是F2的平均值）：

contrast(emmeans(m1, specs="F1", at=list(F1=c(0,1), F2=0)),list(c(-1,1)))
        (above equivalent to: summary(m1)$coefficients$cond["F1",])
        contrast(emmeans(m1, specs="F1", at=list(F1=c(0,1), F2=8)),list(c(-1,1)))
        contrast(emmeans(m1, specs="F1", at=list(F1=c(0,1), F2=25)),list(c(-1,1)))
        contrast(emmeans(m1, specs="F1", at=list(F1=c(0,1), F2=75)),list(c(-1,1)))
        contrast(emmeans(m1, specs="F1", at=list(F1=c(0,1), F2=27)),list(c(-1,1)))

，F2在F1处的斜率= 1、2、3、4、6和3.2（3.2是F1的平均值，不包括零值）：

contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=0)),list(c(-1,1)))
(above equivalent to: summary(m1)$coefficients$cond["F2",])
contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=1)),list(c(-1,1)))
contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=2)),list(c(-1,1)))
contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=3)),list(c(-1,1)))
contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=4)),list(c(-1,1)))
contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=6)),list(c(-1,1)))
contrast(emmeans(m1, specs="F2", at=list(F2=c(0,1), F1=3.2)),list(c(-1,1)))

在F1 = 0和F2 = 0时F1和F2斜率的相互作用

contrast(emmeans(m1, specs=c("F1","F2"), at=list(F1=c(0,1),F2=c(0,1))),list(c(1,-1,-1,1)))
(above equivalent to: summary(m1)$coefficients$cond["F1:F2",])

从emmGrid提供的结果contrast()对象中，可以根据需要选择斜率的估计值（estimate），估计斜率的标准差（{{1} }），Z得分表示估计斜率与零假设空斜率（SE由z.ratio由emmGrid除以estimate得出的估计斜率和对应的P的差值）值（由SE计算为p.value的{{1}}）。

例如：

emmGrid

产量：

2*pnorm(-abs(z.ratio)

glmmTMB，事后测试和glht

2 个答案: