如何为Lasso Logistic回归生成所有一阶交互项?

时间:2014-12-20 05:48:44

标签: r logistic-regression glmnet

glmnet中有没有办法进行一阶交互?

例如,如果我的X矩阵是:

V1 V2 V3
0  1   0
1  0   1
1  0   0
...

有没有办法指定它在“y~V1 + V2 + V3 + V1 * V2 + V2 * V3 + V1 * V3”的行中做某事而无需手动创建列?我的实际矩阵更大,并且手动创建所有一阶交叉产品会很痛苦。

1 个答案:

答案 0 :(得分:7)

这种公式的正确R语法是

y~(V1+V2+V3)^2

例如

set.seed(15)
dd <- data.frame(V1=runif(50), V2=runif(50), V3=runif(50), y=runif(50))
lm(y~(V1+V2+V3)^2, dd)

Call:
lm(formula = y ~ (V1 + V2 + V3)^2, data = dd)

Coefficients:
(Intercept)           V1           V2           V3        V1:V2        V1:V3        V2:V3  
    0.54169     -0.10030     -0.01226     -0.10150      0.38521     -0.03159      0.01200 

或者,如果您想为y以外的所有变量建模,

lm(y~(.)^2, dd)

Call:
lm(formula = y ~ (.)^2, data = dd)

Coefficients:
(Intercept)           V1           V2           V3        V1:V2        V1:V3        V2:V3  
    0.54169     -0.10030     -0.01226     -0.10150      0.38521     -0.03159      0.01200 

两者都与

相同
lm(y~V1+V2+V3+V1:V2+V1:V3+V2:V3, dd)

Call:
lm(formula = y ~ V1 + V2 + V3 + V1:V2 + V1:V3 + V2:V3, data = dd)

Coefficients:
(Intercept)           V1           V2           V3        V1:V2        V1:V3        V2:V3  
    0.54169     -0.10030     -0.01226     -0.10150      0.38521     -0.03159      0.01200  

您可以将这些公式与model.matrix一起使用来创建矩阵

model.matrix(y~(V1+V2+V3)^2,dd)