Question

只想检查我正在做的事情是否正确！

我在几个分为两个栖息地的地方都有鸟类 - 农田和湿地。我只是想看看哪个栖息地有更高的数量。

我正在使用带泊松函数的GLM（因为它们是计数数据）：

> mod <- glm(count ~ habitat, family = "poisson")

> summary(mod)


Call:
glm(formula = count ~ habitat, family = poisson)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-0.5868  -0.4603  -0.2496  -0.2141   2.8464  

Coefficients:
                            Estimate Std. Error z value Pr(>|z|)
(Intercept)                  -0.2695     1.0000  -0.269    0.788
habitatWetland                1.7331     1.0954   1.582    0.114

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 37.802  on 91  degrees of freedom
Residual deviance: 34.373  on 90  degrees of freedom
AIC: 48.987

Number of Fisher Scoring iterations: 6

到目前为止一直很好？

我的理解是（使用默认对比）拦截指的是栖息地：农田 - 所以农田的估计平均数将是exp（-0.2695）。估计湿地的平均数量为exp（1.7331）。

截距p值（0.788）给出截距（即农田中的计数）显着大于零的概率（尽管我对此并不特别感兴趣）。湿地p值（0.114）给出了湿地中的数量与截距不同的概率（即与农田中的数量不同）。因此，在这种情况下，两种栖息地类型之间没有显着差异（在5％水平上）。

这一切都正确吗？还有什么我应该考虑或做的不同吗？

Answer 1

关闭，但对于湿地，速率为exp(-0.2695 + 1.7331)，您对p值的理解是关闭的。 p值不是备选假设为真的概率;如果零假设为真（并且您在类似情况下收集更多数据），那么看到数据的机会至少与观察到的一样极端。

拦截的p值很少有用。从其他系数的p值（0.114）可以看出，没有湿地和农田之间存在差异的证据。

检查R中GLM摘要的解释

1 个答案: