如何在广义加性模型中指定两个因子变量的非线性相互作用[R]

时间:2017-12-10 14:17:12

标签: r gam mgcv

我有一个时间序列数据集,其中包含一个连续的结果变量和两个因子预测变量(一个有6个等级,一个有2个等级)。

我想模拟连续变量上两个因子变量的非线性相互作用。

这是我到目前为止的模型(由于数据的版权限制,我使用的是数据集的子集):

library(mgcv)
load(url("http://ftp.stefanocoretta.altervista.org/documents/df.RData"))

model <- bam(
    outcome ~
        factor_1 + factor_2 +
        s(time, k = 9) +
        s(time, by = factor_1, k = 9) +
        s(time, by = factor_2, k = 9),
    data = df
)

summary(model)
Family: gaussian 
Link function: identity 

Formula:
outcome ~ factor_1 + factor_2 + s(time, k = 9) + s(time, by = factor_1, 
    k = 9) + s(time, by = factor_2, k = 9)

Parametric coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2612.72      23.03 113.465   <2e-16 ***
factor_1b      33.19      27.00   1.229     0.22    
factor_2z    -488.52      27.00 -18.093   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Approximate significance of smooth terms:
                    edf Ref.df      F  p-value    
s(time)           2.564  3.184  6.408 0.000274 ***
s(time):factor_1b 1.000  1.001  0.295 0.587839    
s(time):factor_2z 2.246  2.792 34.281  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

R-sq.(adj) =  0.679   Deviance explained = 69.1%
fREML = 1359.6  Scale est. = 37580     n = 207

现在我想为factor_1添加factor_2timeoutcome的非线性互动,以便每个组合中的平滑器都可以不同(例如:factor_2factor_1的某些级别具有更强的非线性效果。像s(time, factor_1, factor_2)s(time, factor_1, by = factor_2)之类的东西不起作用。

1 个答案:

答案 0 :(得分:1)

使用interaction()包含两个因素的互动似乎可以胜任。

library(mgcv)
load(url("http://ftp.stefanocoretta.altervista.org/documents/df.RData"))

model <- bam(
    outcome ~
        factor_1 + factor_2 +
        s(time, k = 9) +
        s(time, by = interaction(factor_1, factor_2), k = 9),
    data = df
)

编辑:没有必要包括两个单独的光滑,每个光滑都有两个因素。