Question

我正在分析掠食者在地上遇到潜在猎物的情况。我的响应数据是Encounter位置= 1且Random位置= 0的二进制数据，并且我的自变量是连续的，但已重新缩放。

我最初使用的是GLM结构

glm_global <- glm(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
                  Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs,
                  data=Data_scaled, family=binomial)

但意识到这未能说明数据中潜在的空间自相关性（样条曲线相关图显示了高达〜1000m的高残差相关性）。

Correlog_glm_global <- spline.correlog (x = Data_scaled[, "Y"],
                                        y = Data_scaled[, "X"],
                                        z = residuals(glm_global,
                                        type = "pearson"), xmax = 1000)

我试图通过实现一个GLMM（在lme4中）来解决这个问题，其中掠食者组是随机效应。

glmm_global <- glmer(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
                     Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs+(1|Group),
                     data=Data_scaled, family=binomial)

将全局GLMM（1144.7）的AIC与全局GLM（1149.2）进行比较时，我得到的Delta AIC值> 2，这表明GLMM更适合数据。但是，我仍然在残差中获得基本相同的相关性，如GLMM模型的样条曲线相关图所示。

Correlog_glmm_global <- spline.correlog (x = Data_scaled[, "Y"],
                                         y = Data_scaled[, "X"],
                                         z = residuals(glmm_global,
                                         type = "pearson"), xmax = 10000)

我还尝试将所有位置的Lat * Long明确包含为自变量，但结果相同。阅读完选项后，我尝试在“ geepack”中运行通用估计方程（GEE），认为这将使我在显式定义相关结构（如在用于正态分布的响应数据的GLS模型中）方面更具灵活性。复合对称性（这是我们使用GLMM获得的）。但是我意识到我的数据仍然需要使用复合对称性（在geepack中是“可互换的”），因为我在数据中没有时间顺序。当我运行全局模型时

gee_global <- geeglm(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
                     Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs,
                     id=Pride, corstr="exchangeable", data=Data_scaled, family=binomial)

（使用缩放或未缩放的数据没有区别，因此与缩放数据保持一致）突然，我的协变量都没有显着变化。但是，作为GEE建模的新手，我不知道a）这是否是此数据的有效方法，或者b）这是否已经解决了整个过程中明显存在的剩余自相关问题。

对于一些建设性的反馈，我将是最感激的：1）一旦我意识到GLMM模型（以捕食者为随机效应）仍显示出空间自相关的皮尔逊残差（最大1000m），该往哪个方向前进，2 ）是否确实在这一点上适用GEE模型，以及3）如果我在GEE建模中遗漏了某些东西。非常感谢。

Answer 1

可以通过多种方法来考虑模型中的空间自相关。我将限制对处理随机效果的R主程序包的响应。

首先，您可以使用软件包 nlme ，并在残差中指定一个相关结构（有许多可用的：corGaus，corLin，CorSpher ...）。您应该尝试其中的许多方法，并保持最佳模型。在这种情况下，空间自相关被认为是连续的，并且可以通过全局函数来近似。

第二，您可以使用软件包 mgcv ，然后将双变量样条线（空间坐标）添加到模型中。这样，您可以捕获一个空间图案，甚至对其进行映射。从严格的意义上讲，该方法未考虑空间自相关，但可以解决该问题。如果您的空间是离散的，则可以使用随机的马尔可夫场平滑。该网站对查找一些示例非常有帮助：https://www.fromthebottomoftheheap.net

第三，您可以使用软件包 brms 。这使您可以在残差（CAR和SAR）中指定具有其他相关结构的非常复杂的模型。该软件包使用贝叶斯方法。

我希望能有所帮助。祝你好运

如何处理GLMM中的空间自相关残差

1 个答案: