只想检查我正在做的事情是否正确!
我在几个分为两个栖息地的地方都有鸟类 - 农田和湿地。我只是想看看哪个栖息地有更高的数量。
我正在使用带泊松函数的GLM(因为它们是计数数据):
> mod <- glm(count ~ habitat, family = "poisson")
> summary(mod)
Call:
glm(formula = count ~ habitat, family = poisson)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.5868 -0.4603 -0.2496 -0.2141 2.8464
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.2695 1.0000 -0.269 0.788
habitatWetland 1.7331 1.0954 1.582 0.114
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 37.802 on 91 degrees of freedom
Residual deviance: 34.373 on 90 degrees of freedom
AIC: 48.987
Number of Fisher Scoring iterations: 6
到目前为止一直很好?
我的理解是(使用默认对比)拦截指的是栖息地:农田 - 所以农田的估计平均数将是exp(-0.2695)。估计湿地的平均数量为exp(1.7331)。
截距p值(0.788)给出截距(即农田中的计数)显着大于零的概率(尽管我对此并不特别感兴趣)。湿地p值(0.114)给出了湿地中的数量与截距不同的概率(即与农田中的数量不同)。因此,在这种情况下,两种栖息地类型之间没有显着差异(在5%水平上)。
这一切都正确吗?还有什么我应该考虑或做的不同吗?
答案 0 :(得分:0)
关闭,但对于湿地,速率为exp(-0.2695 + 1.7331)
,您对p值的理解是关闭的。 p值不是备选假设为真的概率;如果零假设为真(并且您在类似情况下收集更多数据),那么看到数据的机会至少与观察到的一样极端。
拦截的p值很少有用。从其他系数的p值(0.114)可以看出,没有湿地和农田之间存在差异的证据。