Question

我想知道如何解释套索回归的输出。举个例子：

library(lasso2)
lm.lasso <- l1ce(mpg ~ . , data=mtcars)
summary(lm.lasso)$coefficients

输出结果为：

              Value  Std. Error     Z score   Pr(>|Z|)
(Intercept) 36.01809203 18.92587647  1.90311355 0.05702573
cyl         -0.86225790  1.12177221 -0.76865686 0.44209704
disp         0.00000000  0.01912781  0.00000000 1.00000000
hp          -0.01399880  0.02384398 -0.58709992 0.55713660
drat         0.05501092  1.78394922  0.03083659 0.97539986
wt          -2.68868427  2.05683876 -1.30719254 0.19114733
qsec         0.00000000  0.75361628  0.00000000 1.00000000
vs           0.00000000  2.31605743  0.00000000 1.00000000
am           0.44530641  2.14959278  0.20715850 0.83588608
gear         0.00000000  1.62955841  0.00000000 1.00000000
carb        -0.09506985  0.91237207 -0.10420075 0.91701004

如果我理解正确，套索回归应该基本上最小化对模型不重要的特征，因此它们的系数基本上为零。这对qsec，vs和gear功能有意义。但是，p值都非常微不足道。

如果我的系数基本为零，但p值接近1，我应该信任哪个值？我应该从模型中丢弃该特征，因为它的系数为零，或者从模型中丢弃它，因为它的p值是无关紧要的吗？

Answer 1

零假设是变量系数等于零并且对模型没有影响。为了拒绝零假设，你需要得到一个低于0.05的p值，值越小，你对拒绝零假设的信心就越大。

因此，如果值为1.00，则在评估p值时，这意味着在拒绝零假设时没有置信度（它是零影响系数）。

因此，在您的模型中，回归将系数降为零，p值为1，它支持您理解套索如何将非影响值降低到零系数。你应该相信零和一个！

解释套索回归p值与系数

1 个答案: