我知道R
中有一条快捷方式可以对所有数据框进行lm()
回归,如下所示:
reg<-lm(y~.,data=df)
df具有解释变量x1,x2,... x5,所以它与写作相同
reg<-lm(y~x1+x2+x3+x4+x5,data=df)
但是,这并不包含x1:x2之类的交互术语,... R
中是否有快捷方式可以对数据框的所有列进行回归?
我正在寻找2个与
reg<-lm(y~x1*x2,x1*x3,x1*x4,x1*x5,x2*x3,...)
reg<-lm(y~x1*x2*x3*x4*x5) # this one will have interactions between the 5 variables
答案 0 :(得分:7)
两者都可以使用^
运算符。
参见示例:
在你的第一种情况下,你只需要成对的互动(双向互动)。所以你可以这样做:
#Example df
df <- data.frame(a=runif(1:100), b=runif(1:100), c=runif(1:100), d=runif(1:100))
> lm(a ~ (b+c+d)^2, data=df)
Call:
lm(formula = a ~ (b + c + d)^2, data = df)
Coefficients:
(Intercept) b c d b:c b:d c:d
0.53873 0.23531 0.07813 -0.14763 -0.43130 0.11084 0.13181
正如您所看到的,上面产生了成对的互动
现在,为了包含您可以执行的所有互动:
> lm(a ~ (b+c+d)^5 , data=df)
Call:
lm(formula = a ~ (b + c + d)^5, data = df)
Coefficients:
(Intercept) b c d b:c b:d c:d b:c:d
0.54059 0.23123 0.07455 -0.15150 -0.42340 0.11926 0.14017 -0.01803
在这种情况下,您只需要使用一个大于您将使用的变量数的数字(在这种情况下,我使用5但它可能大于3)。如你所见,所有的互动都会产生。