我正在尝试使用GAMM来获得两组人的季节性趋势。我进行了两次分析,改变了解释变量的级别顺序,以便得到每个级别的季节性趋势图 但是,我对两个GAMM的输出感到惊讶,因为它们根据解释变量的级别顺序而变化。我预计结果将是相同的,因为数据和模型在两种情况下都是相同的。但是,如下所示,结果会改变所研究数据的推断。
我的数据库包含下一个变量:
物种:4个等级
人口:20级
Reproductive_State:2级
Survival_probability:范围[0-1]
年
月
双周:从1到26(分析中称为季节性)
我试图得到一个描述性的估计和“物种的共同季节性生存”图,检查变量reproductive_state的两个水平之间是否存在差异。
为了检查它,我执行了:
# Specify the contrast: Reproductive group
data$Reproductive_Group <- as.factor (data$Reproductive_State)
data$Reproductive_Group <- as.ordered(data$Reproductive_Group )
contrasts(data$Reproductive_Group )<-'contr.treatment'
model_1 <- gam (Survival_probability ~ Reproductive_Group + s(Seasonality) + s(Seasonality, by=Reproductive_Group ), random=list(Species=~1, Population=~1), family=quasibinomial, data=data)
稍后我更改Reproductive_Group
级别的顺序并执行相同的分析:
data$Reproductive_Group <- factor (data$Reproductive_Group , levels=c("phiNB", "phiB"))
levels (data$Reproductive_Group )
model_2 <- gam (Survival_probability ~ Reproductive_Group + s(Seasonality) + s(Seasonality, by=Reproductive_Group ), random=list(Species=~1, Population=~1), family=quasibinomial, data=data)
在第一个模型中输出为:
Formula:
Survival_probability ~ +s(Seasonality) + s(Seasonality, by = Rep_Group)
Parametric coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.83569 0.01202 152.8 <2e-16 ***
Approximate significance of smooth terms:
edf Ref.df F p-value
s(Seasonality) 3.201 3.963 2.430 0.05046 .
s(Seasonality):Rep_GroupphiNB 5.824 6.956 2.682 0.00991 **
而第二个模型的输出是:
Formula:
Survival_probability ~ +s(Seasonality) + s(Seasonality, by = Rep_Group)
Parametric coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.83554 0.01205 152.4 <2e-16 ***
Approximate significance of smooth terms:
edf Ref.df F p-value
s(Seasonality) 5.927 7.061 6.156 3.66e-07 ***
s(Seasonality):Rep_GroupphiB 3.218 3.981 1.029 0.411
此外,我附上了两个模型的情节:
Group_B_as_second_level
Group_NB_as_second_level
我认为两种分析的季节性情节应该相同,只要它完全代表季节性。然而,如果季节性反映了另一个级别的季节性趋势,则第一张图片的情节1应该与第二张图片的情节2匹配,反之亦然,他们不会这样做。
要注意的是,我按照博客Overview GAMM analysis of time series data写了公式并检查了两个生殖状态的季节性趋势的差异。
你知道为什么我用这两个模型得到不同的结果吗?