lm()回归与整个数据帧的交互

时间:2015-10-22 12:34:58

标签: r regression lm

我知道R中有一条快捷方式可以对所有数据框进行lm()回归,如下所示:

reg<-lm(y~.,data=df)

df具有解释变量x1,x2,... x5,所以它与写作相同

reg<-lm(y~x1+x2+x3+x4+x5,data=df)

但是,这并不包含x1:x2之类的交互术语,... R中是否有快捷方式可以对数据框的所有列进行回归? 我正在寻找2个与

具有相同效果的快捷方式
reg<-lm(y~x1*x2,x1*x3,x1*x4,x1*x5,x2*x3,...)
reg<-lm(y~x1*x2*x3*x4*x5) # this one will have interactions between the 5 variables

1 个答案:

答案 0 :(得分:7)

两者都可以使用^运算符。

参见示例:

在你的第一种情况下,你只需要成对的互动(双向互动)。所以你可以这样做:

#Example df
df <- data.frame(a=runif(1:100), b=runif(1:100), c=runif(1:100), d=runif(1:100))

> lm(a ~ (b+c+d)^2, data=df)

Call:
lm(formula = a ~ (b + c + d)^2, data = df)

Coefficients:
(Intercept)            b            c            d          b:c          b:d          c:d  
    0.53873      0.23531      0.07813     -0.14763     -0.43130      0.11084      0.13181  

正如您所看到的,上面产生了成对的互动

现在,为了包含您可以执行的所有互动:

> lm(a ~ (b+c+d)^5 , data=df)

Call:
lm(formula = a ~ (b + c + d)^5, data = df)

Coefficients:
(Intercept)            b            c            d          b:c          b:d          c:d        b:c:d  
    0.54059      0.23123      0.07455     -0.15150     -0.42340      0.11926      0.14017     -0.01803  

在这种情况下,您只需要使用一个大于您将使用的变量数的数字(在这种情况下,我使用5但它可能大于3)。如你所见,所有的互动都会产生。