GAM:为什么mgcv :: gam对解释变量

时间:2016-08-09 17:16:56

标签: r time-series gam model-fitting

我正在尝试使用GAMM来获得两组人的季节性趋势。我进行了两次分析,改变了解释变量的级别顺序,以便得到每个级别的季节性趋势图 但是,我对两个GAMM的输出感到惊讶,因为它们根据解释变量的级别顺序而变化。我预计结果将是相同的,因为数据和模型在两种情况下都是相同的。但是,如下所示,结果会改变所研究数据的推断。

我的数据库包含下一个变量:
物种:4个等级 人口:20级 Reproductive_State:2级
Survival_probability:范围[0-1]


双周:从1到26(分析中称为季节性)

我试图得到一个描述性的估计和“物种的共同季节性生存”图,检查变量reproductive_state的两个水平之间是否存在差异。

为了检查它,我执行了:

# Specify the contrast: Reproductive group
data$Reproductive_Group <- as.factor (data$Reproductive_State)
data$Reproductive_Group <- as.ordered(data$Reproductive_Group )
contrasts(data$Reproductive_Group )<-'contr.treatment'

model_1 <- gam (Survival_probability ~ Reproductive_Group + s(Seasonality) + s(Seasonality, by=Reproductive_Group ), random=list(Species=~1, Population=~1), family=quasibinomial, data=data)

稍后我更改Reproductive_Group级别的顺序并执行相同的分析:

data$Reproductive_Group <- factor (data$Reproductive_Group , levels=c("phiNB", "phiB"))
levels (data$Reproductive_Group )

model_2 <- gam (Survival_probability ~ Reproductive_Group + s(Seasonality) + s(Seasonality, by=Reproductive_Group ), random=list(Species=~1, Population=~1), family=quasibinomial, data=data)

在第一个模型中输出为:

Formula:
Survival_probability ~ +s(Seasonality) + s(Seasonality, by = Rep_Group)

Parametric coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.83569    0.01202   152.8   <2e-16 ***

Approximate significance of smooth terms:
                                edf Ref.df     F p-value   
s(Seasonality)                3.201  3.963 2.430 0.05046 . 
s(Seasonality):Rep_GroupphiNB 5.824  6.956 2.682 0.00991 **

而第二个模型的输出是:

Formula:
Survival_probability ~ +s(Seasonality) + s(Seasonality, by = Rep_Group)

Parametric coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.83554    0.01205   152.4   <2e-16 ***

Approximate significance of smooth terms:
                               edf Ref.df     F  p-value    
s(Seasonality)               5.927  7.061 6.156 3.66e-07 ***
s(Seasonality):Rep_GroupphiB 3.218  3.981 1.029    0.411   

此外,我附上了两个模型的情节:
Group_B_as_second_level
Group_B_as_second_level Group_NB_as_second_level
Group_NB_as_second_level

我认为两种分析的季节性情节应该相同,只要它完全代表季节性。然而,如果季节性反映了另一个级别的季节性趋势,则第一张图片的情节1应该与第二张图片的情节2匹配,反之亦然,他们不会这样做。

要注意的是,我按照博客Overview GAMM analysis of time series data写了公式并检查了两个生殖状态的季节性趋势的差异。

你知道为什么我用这两个模型得到不同的结果吗?

0 个答案:

没有答案