R

时间:2019-05-01 13:10:14

标签: r panel lasso

在给定年份的个人数据集中,我有许多连续的自变量和因变量。我想使用Logistic随机效果套索/ Logistic固定效果套索执行功能选择。但是,估算程序的glmnet的默认设置是,当我希望R将数据视为面板数据时,我正在使用横​​截面数据,因此,当我希望对Logistic套索进行建模时Logistic随机效应套索/ Logistic固定效应套索模型。

因此,在下面的示例代码中,我想让R知道我正在使用面板数据集,并且ID是我的个人/横截面单位,year是我对每个ID观察的年份。在下面的代码中,所有个人都被汇总,在Logistic Lasso估计中,我什至得到了ID(和year)的系数。如何在R中估算Logistic随机效应套索/ Logistic固定效应套索模型?

df=cbind(c(1,546,2,56,6,73,4234,436,647,567,87,2,5,76,5,456,6756,6,132,78,32),c(2,3546,26,568,76,873,234,36,67,57,887,29,50,736,51,56,676,62,32,782,322),10:30)
year=rep(1:3, times=7)
ID=rep(1:7, each=3)
x=as.matrix(cbind(ID,year,df))
y1=as.data.frame(rep(c(0,1), each = 18))[1:21,]
y=as.matrix(y1)

fit=glmnet(x,y,alpha=1,family="binomial")
lambdamin=min(fit$lambda)
predict.glmnet(fit,s=lambdamin,newx=x,type="coefficients")
                        1
(Intercept) -8.309211e+01
ID           1.281220e+01
year         .           
            -2.339904e-04
             .           
             .           

1 个答案:

答案 0 :(得分:0)

对于套索+ FE,您可以先遵循以下给出的逻辑来降低回归的两面。 here,然后通过glmnet运行套索。

Lasso + random效果在数学上有点more complicated beast,而且glmnet不支持开箱即用。有一个用于执行混合模型套索here的程序包,但我还没有尝试过。