检查R中GLM摘要的解释

时间:2017-12-19 16:48:03

标签: r glm poisson

只想检查我正在做的事情是否正确!

我在几个分为两个栖息地的地方都有鸟类 - 农田和湿地。我只是想看看哪个栖息地有更高的数量。

我正在使用带泊松函数的GLM(因为它们是计数数据):

> mod <- glm(count ~ habitat, family = "poisson")

> summary(mod)


Call:
glm(formula = count ~ habitat, family = poisson)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-0.5868  -0.4603  -0.2496  -0.2141   2.8464  

Coefficients:
                            Estimate Std. Error z value Pr(>|z|)
(Intercept)                  -0.2695     1.0000  -0.269    0.788
habitatWetland                1.7331     1.0954   1.582    0.114

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 37.802  on 91  degrees of freedom
Residual deviance: 34.373  on 90  degrees of freedom
AIC: 48.987

Number of Fisher Scoring iterations: 6

到目前为止一直很好?

我的理解是(使用默认对比)拦截指的是栖息地:农田 - 所以农田的估计平均数将是exp(-0.2695)。估计湿地的平均数量为exp(1.7331)。

截距p值(0.788)给出截距(即农田中的计数)显着大于零的概率(尽管我对此并不特别感兴趣)。湿地p值(0.114)给出了湿地中的数量与截距不同的概率(即与农田中的数量不同)。因此,在这种情况下,两种栖息地类型之间没有显着差异(在5%水平上)。

这一切都正确吗?还有什么我应该考虑或做的不同吗?

1 个答案:

答案 0 :(得分:0)

关闭,但对于湿地,速率为exp(-0.2695 + 1.7331),您对p值的理解是关闭的。 p值不是备选假设为真的概率;如果零假设为真(并且您在类似情况下收集更多数据),那么看到数据的机会至少与观察到的一样极端。

拦截的p值很少有用。从其他系数的p值(0.114)可以看出,没有湿地和农田之间存在差异的证据。