Question

我正在研究独角兽丰度如何随食品质量而变化，但我不确定如何定义相应混合效应模型（以下简称：MEM）的随机部分。

数据结构：我们在 12 个月的时间里对七个地点进行了采样。对于每个月的每个位置，我们都有一个食品质量值（连续预测器）。对于每个月的每个位置，连续四天重新计算独角兽的数量，以考虑独角兽的移动和可能的抽样误差。

分析：我们使用具有泊松分布残差的广义混合效应模型来解释响应变量由计数数据表示的事实。

问题：我想定义我的模型的随机部分，以解释我们对每个位置每个月的独角兽丰度重复测量的事实，和 em> 可能存在局部效应，影响观察到的独角兽丰度变化与食品质量之间的关系。如果我要创建一个 MEM 来仅考虑局部效应，我会将其写为：

lme4::glmer(n.unicorns ~ food.quality + (1 + food.quality | locality), family=“poisson”)

如果我要创建一个 MEM 来仅考虑采样时间的随机影响（每个月的采样日嵌套在采样月中），我相信它会是：

lme4::glmer(n.unicorns ~ food.quality + (1 + food.quality | survey_month/survey_day), family=“poisson”)

但是如何解释每个采样月每个地点的重复测量？我不确定 survey_month/survey_day 和 locality 之间的关系。 survey_month/survey_day 是否嵌套在 locality 中？反之亦然？或者 survey_day/survey_month 和 locality 的随机效应是否被视为彼此独立和独立的？我将后者编码为：

lme4::glmer(n.unicorns ~ food.quality + (1 + food.quality | survey_month/survey_day) + (1 + food.quality | locality), family=“poisson”)

我的 MEM 技能有点生疏。

Answer 1

我得出的结论是，多亏了多人和 sources 的输入，survey_month 和 locality 不是嵌套的：每个级别的 survey_month 都可用对于每个地区，每个调查月都有 locality 的每个级别。因此，暂时忽略 survey_day，模型将是：

lme4::glmer(n.unicorns ~ food.quality
+ (1 + food.quality | locality)
+ (1  + food.quality | survey_month),
family=“poisson”)

关于 survey_day，@benimwolfspelz 指出“考虑 [...] 重复测量不是聚类问题，而是自相关问题”。使用包 glmmTMB（参见 vignette）可以轻松计算自相关：

# survey_day must be provided to glmmTMB as a factor:
unicorns$survey_day_f <- numFactor(unicorns$survey_day)
levels(unicorns$survey_day_f)

glmmTMB::glmmTMB(n.unicorns ~ food.quantity
                        + (1 + food.quality | locality)
                        + (1 + food.quality | survey_month)
                        + ou(survey_day_f + 0 | locality),
                        family="poisson", data=unicorns)

请参阅 here 和 here 以了解有关自相关项语法的更多详细信息以及为什么我使用 ou() 而不是 ar1()（或只需阅读 {{ 3}} 比我最初做的更仔细）。

如何在混合效应模型中定义非独立随机效应？

1 个答案: