我正在使用GAM模型根据给定点的某些环境条件预测物种丰度。我已经创建了一个广义加法模型(GAM)来做这个并基于我的预测。但是,我有一个分类变量(沉积物 在模型方程中输入= [1,2,3,4])。然而,这个等式似乎工作正常 拟合的结果似乎将因子水平'1'吸收到截距中。见下文。
有谁可以解释这个模型发生了什么?我不完全明白。这是使用mgcv包在R中运行的。谢谢!
Equation:
abundance ~ s(x) + s(y) + s(z) + s(w) + factor(Sediment)
Parametric coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) ------------_7.138 ----- 0.000 ------7541.26 2e-16
factor(Sediment)2 -0.2496868 0.0016749 -149.08 2e-16
factor(Sediment)3 -0.5128687 0.0058931 -87.03 2e-16
factor(Sediment)4 -0.1467369 0.0034606 -42.40 2e-16
Approximate significance of smooth terms:
_________ _edf Ref.df Chi.sq p-value
s(x) 3.983 4 69264 2e-16
s(y) 3.998 4 1147536 2e-16
s(z) 3.995 4 197458 2e-16
s(w) 3.999 4 340085 2e-16
答案 0 :(得分:4)
截距表示沉积物类型1的平均丰度,因为这将是参考水平(第一级)。估算值是其他沉积物类型的系数,表示该类型与参考水平的偏差(沉积物类型1)。
这是模型中具有因子变量的标准惯例;如果你在模型中有一个截距,你不能用它来表示和每个级别的因子,因为模型矩阵的结果列将是线性相互依赖的 - 你可以表示相同的信息模型矩阵中至少少一列。
如果你愿意,你可以通过在公式中添加- 1
来删除拦截,但我没有在这里看到这样做的理由。