GAM下降的因子水平适合

时间:2012-06-12 16:44:50

标签: r r-factor gam

我正在使用GAM模型根据给定点的某些环境条件预测物种丰度。我已经创建了一个广义加法模型(GAM)来做这个并基于我的预测。但是,我有一个分类变量(沉积物 在模型方程中输入= [1,2,3,4])。然而,这个等式似乎工作正常 拟合的结果似乎将因子水平'1'吸收到截距中。见下文。

有谁可以解释这个模型发生了什么?我不完全明白。这是使用mgcv包在R中运行的。谢谢!

Equation:            
abundance ~ s(x) + s(y) + s(z) + s(w) + factor(Sediment)
Parametric coefficients:  
Estimate Std. Error z value Pr(>|z|)

(Intercept)   ------------_7.138 ----- 0.000 ------7541.26   2e-16  
        factor(Sediment)2 -0.2496868  0.0016749 -149.08   2e-16  
        factor(Sediment)3 -0.5128687  0.0058931  -87.03   2e-16  
        factor(Sediment)4 -0.1467369  0.0034606  -42.40   2e-16

Approximate significance of smooth terms:  
              _________   _edf Ref.df  Chi.sq p-value    
s(x) 3.983      4   69264  2e-16  
s(y)  3.998      4 1147536  2e-16   
s(z)  3.995      4  197458  2e-16  
s(w)   3.999      4  340085  2e-16

1 个答案:

答案 0 :(得分:4)

截距表示沉积物类型1的平均丰度,因为这将是参考水平(第一级)。估算值是其他沉积物类型的系数,表示该类型与参考水平的偏差(沉积物类型1)。

这是模型中具有因子变量的标准惯例;如果你在模型中有一个截距,你不能用它来表示每个级别的因子,因为模型矩阵的结果列将是线性相互依赖的 - 你可以表示相同的信息模型矩阵中至少少一列。

如果你愿意,你可以通过在公式中添加- 1来删除拦截,但我没有在这里看到这样做的理由。