套索选择的系数和置信区间

时间:2014-10-13 17:36:37

标签: lasso

我使用套索方法进行了特征选择,并使用covTest::covTest进行协方差检验以检索p.values。我从covTest借了一个例子:

require(lars)
require(covTest)
set.seed(1234)
x=matrix(rnorm(100*10),ncol=10)
x=scale(x,TRUE,TRUE)/sqrt(99)
beta=c(4,rep(0,9))
y=x%*%beta+.4*rnorm(100)

a=lars(x,y)
covTest(a,x,y)
$results
 Predictor_Number Drop_in_covariance P-value
                1           105.7307  0.0000
                6             0.9377  0.3953
               10             0.2270  0.7974
                3             0.0689  0.9334
                7             0.1144  0.8921
                2             0.0509  0.9504
                9             0.0508  0.9505
                8             0.0006  0.9994
                4             0.1190  0.8880
                5             0.0013  0.9987

$sigma
[1] 0.3705

$null.dist
[1] "F(2,90)

covTest的结果显示了最受欢迎的特征的p值。我的问题是如何检索这些特征的系数,例如预测变量1以及Std.err95%CI的系数。我将这些估算值与glm的对应物进行比较。

0 个答案:

没有答案