我有一系列 700个可能的变量来解释(Y),它们都是连续变量。这700个变量是滞后的,并且计算了过去12个月的新滞后变量,因此从最初的700个开始,我们最终得到8200个可能的变量来解释(Y)过程。有110个可用的障碍物,在消除N / A数据后仅使用98个。
要执行自适应套索,我首先需要计算岭回归中的最佳Beta系数,并将它们作为在岭之后应用的Lasso的额外惩罚。这个过程可以通过glmnet包完成。
但是, Glmnet CV函数似乎不适合时间序列,因为滞后变量中涉及的一些信息可能会在一些折叠上应用CV时被破坏。在滚动窗口和样本内数据中进行CV或留下一个CV可能更合适。
我从R中找到了一些执行其中一些要求的软件包,但到目前为止我发现的软件包在时间序列所需的CV过程中失败了。
这是我遇到的一些缺点。
Glmnet ,似乎使用CV不适合时间序列,因为一些滞后信息/属性在CV折叠中丢失。
HDeconometrics ,似乎有正确的CV过程,但我无法从github安装到R中,而且我似乎没有多少人使用它。
install_github( “gabrielrvsc / HDeconometrics”) FAILED
Msgps :似乎直接运行Adaptive Lasso但没有控制CV的选项,我不确定正在执行什么类型的CV。
BigVar ,似乎使用了精彩的CV流程,但更专为VAR而设计。可以在滚动窗口策略中使用CV或留出一个。
有没有人通过我提到的软件包知道其他软件包或可能的解决方案?
提前感谢您的帮助