如何处理GLMM中的空间自相关残差

时间:2018-11-07 08:07:19

标签: r geospatial data-modeling

我正在分析掠食者在地上遇到潜在猎物的情况。我的响应数据是Encounter位置= 1且Random位置= 0的二进制数据,并且我的自变量是连续的,但已重新缩放。

我最初使用的是GLM结构

glm_global <- glm(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
                  Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs,
                  data=Data_scaled, family=binomial)

但意识到这未能说明数据中潜在的空间自相关性(样条曲线相关图显示了高达〜1000m的高残差相关性)。

Correlog_glm_global <- spline.correlog (x = Data_scaled[, "Y"],
                                        y = Data_scaled[, "X"],
                                        z = residuals(glm_global,
                                        type = "pearson"), xmax = 1000)

我试图通过实现一个GLMM(在lme4中)来解决这个问题,其中掠食者组是随机效应。

glmm_global <- glmer(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
                     Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs+(1|Group),
                     data=Data_scaled, family=binomial)

将全局GLMM(1144.7)的AIC与全局GLM(1149.2)进行比较时,我得到的Delta AIC值> 2,这表明GLMM更适合数据。但是,我仍然在残差中获得基本相同的相关性,如GLMM模型的样条曲线相关图所示。

Correlog_glmm_global <- spline.correlog (x = Data_scaled[, "Y"],
                                         y = Data_scaled[, "X"],
                                         z = residuals(glmm_global,
                                         type = "pearson"), xmax = 10000)

我还尝试将所有位置的Lat * Long明确包含为自变量,但结果相同。 阅读完选项后,我尝试在“ geepack”中运行通用估计方程(GEE),认为这将使我在显式定义相关结构(如在用于正态分布的响应数据的GLS模型中)方面更具灵活性。复合对称性(这是我们使用GLMM获得的)。但是我意识到我的数据仍然需要使用复合对称性(在geepack中是“可互换的”),因为我在数据中没有时间顺序。当我运行全局模型时

gee_global <- geeglm(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
                     Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs,
                     id=Pride, corstr="exchangeable", data=Data_scaled, family=binomial)

(使用缩放或未缩放的数据没有区别,因此与缩放数据保持一致) 突然,我的协变量都没有显着变化。但是,作为GEE建模的新手,我不知道a)这是否是此数据的有效方法,或者b)这是否已经解决了整个过程中明显存在的剩余自相关问题。

对于一些建设性的反馈,我将是最感激的:1)一旦我意识到GLMM模型(以捕食者为随机效应)仍显示出空间自相关的皮尔逊残差(最大1000m),该往哪个方向前进,2 )是否确实在这一点上适用GEE模型,以及3)如果我在GEE建模中遗漏了某些东西。非常感谢。

1 个答案:

答案 0 :(得分:0)

可以通过多种方法来考虑模型中的空间自相关。我将限制对处理随机效果的R主程序包的响应。

首先,您可以使用软件包 nlme ,并在残差中指定一个相关结构(有许多可用的:corGaus,corLin,CorSpher ...)。您应该尝试其中的许多方法,并保持最佳模型。在这种情况下,空间自相关被认为是连续的,并且可以通过全局函数来近似。

第二,您可以使用软件包 mgcv ,然后将双变量样条线(空间坐标)添加到模型中。这样,您可以捕获一个空间图案,甚至对其进行映射。从严格的意义上讲,该方法未考虑空间自相关,但可以解决该问题。如果您的空间是离散的,则可以使用随机的马尔可夫场平滑。该网站对查找一些示例非常有帮助:https://www.fromthebottomoftheheap.net

第三,您可以使用软件包 brms 。这使您可以在残差(CAR和SAR)中指定具有其他相关结构的非常复杂的模型。该软件包使用贝叶斯方法。

我希望能有所帮助。祝你好运