我使用套索方法进行了特征选择,并使用covTest::covTest
进行协方差检验以检索p.values。我从covTest
借了一个例子:
require(lars)
require(covTest)
set.seed(1234)
x=matrix(rnorm(100*10),ncol=10)
x=scale(x,TRUE,TRUE)/sqrt(99)
beta=c(4,rep(0,9))
y=x%*%beta+.4*rnorm(100)
a=lars(x,y)
covTest(a,x,y)
$results
Predictor_Number Drop_in_covariance P-value
1 105.7307 0.0000
6 0.9377 0.3953
10 0.2270 0.7974
3 0.0689 0.9334
7 0.1144 0.8921
2 0.0509 0.9504
9 0.0508 0.9505
8 0.0006 0.9994
4 0.1190 0.8880
5 0.0013 0.9987
$sigma
[1] 0.3705
$null.dist
[1] "F(2,90)
covTest的结果显示了最受欢迎的特征的p值。我的问题是如何检索这些特征的系数,例如预测变量1以及Std.err
和95%CI
的系数。我将这些估算值与glm
的对应物进行比较。