自适应时代系列套索

时间:2018-04-12 15:53:53

标签: r lasso

我有一系列 700个可能的变量来解释(Y),它们都是连续变量。这700个变量是滞后的,并且计算了过去12个月的新滞后变量,因此从最初的700个开始,我们最终得到8200个可能的变量来解释(Y)过程。有110个可用的障碍物,在消除N / A数据后仅使用98个。

要执行自适应套索,我首先需要计算岭回归中的最佳Beta系数,并将它们作为在岭之后应用的Lasso的额外惩罚。这个过程可以通过glmnet包完成。

但是, Glmnet CV函数似乎不适合时间序列,因为滞后变量中涉及的一些信息可能会在一些折叠上应用CV时被破坏。在滚动窗口和样本内数据中进行CV或留下一个CV可能更合适。

我从R中找到了一些执行其中一些要求的软件包,但到目前为止我发现的软件包在时间序列所需的CV过程中失败了。

这是我遇到的一些缺点。

  • Glmnet ,似乎使用CV不适合时间序列,因为一些滞后信息/属性在CV折叠中丢失。

  • HDeconometrics ,似乎有正确的CV过程,但我无法从github安装到R中,而且我似乎没有多少人使用它。

    install_github( “gabrielrvsc / HDeconometrics”) FAILED

  • Msgps :似乎直接运行Adaptive Lasso但没有控制CV的选项,我不确定正在执行什么类型的CV。

  • BigVar ,似乎使用了精彩的CV流程,但更专为VAR而设计。可以在滚动窗口策略中使用CV或留出一个。

有没有人通过我提到的软件包知道其他软件包或可能的解决方案?

提前感谢您的帮助

0 个答案:

没有答案