关于使用R中的Caret包进行的LASSO logistic回归的截距项

时间:2019-09-02 02:57:35

标签: r r-caret glmnet lasso-regression

我使用插入符号程序包拟合了LASSO逻辑回归模型,

require(ISLR)
require(caret)

mod_fitg <- train(Direction ~ Lag1 + Lag2 + Lag3 + Lag4 + Volume,
                  data=Smarket, method = "glmnet", 

                  tuneGrid=expand.grid(
                    .alpha=1,
                    .lambda=(0.002)),
                  family="binomial")


coef(mod_fitg$finalModel, mod_fitg$bestTune$lambda)

6 x 1 sparse Matrix of class "dgCMatrix"
                       1
(Intercept) -0.088472239
Lag1        -0.065571845
Lag2        -0.035641733
Lag3         0.003564326
Lag4         0.001534829
Volume       0.110035397 

上述系数是通过默认值进行标准化的系数,glmnet软件包对系数进行了标准化。 在此输出中,我想知道拦截项的含义

由于标准化之后,应该没有拦截项(根据使用glmnet软件包的同一模型的模型系数)

y <- Smarket$Direction
x <- model.matrix(Direction ~ Lag1 + Lag2 + Lag3 + Lag4 + Volume, Smarket)[, -1]

lasso.mod <- glmnet(x,y, alpha = 1, lambda = 0.002,family='binomial')

lasso.mod$beta

5 x 1 sparse Matrix of class "dgCMatrix"
                 s0
Lag1   -0.065571799
Lag2   -0.035641706
Lag3    0.003564320
Lag4    0.001534812
Volume  0.110035335

1 个答案:

答案 0 :(得分:1)

您的两个模型相同,只是截距系数存储在lasso.mod中。

lasso.mod$a0