我用" vars" R包做多变量时间序列分析。事情就是当我进行双变量VAR时,serial.test()的结果总是给出一个非常低的p值,所以我们拒绝H0并且残差是相关的。正确的做法是增加VAR的顺序,但即使有很高的顺序(p = 20甚至更多),我的残差仍然是相关的。 怎么可能?
我无法真正为您提供可重现的代码,因为我不知道如何重现具有始终相关残差的VAR。对我而言,这是一个非常不寻常的情况,但如果有人知道它是如何可能的话会很棒。
答案 0 :(得分:1)
这对Cross Validated来说可能是一个更好的问题,因为它不包含任何R代码或可重复的示例,但您可能需要进行更多挖掘,而不是“我的p值较低”。您是否测试了数据的正常性?另外,要说
正确的做法是增加VAR的顺序
非常不准确。您正在使用哪种类型的数据来设置高达20的滞后顺序?年度数据的典型值为1,季度为4,月度为12.您不能只是继续向您的问题投掷越来越高的订单,并期望它能解决基础数据中的问题。
假设您有一个最佳滞后值并且您的数据是正态分布的,并且您的p值仍然很低,那么有几种方法可以实现。
正序列相关的少数情况(例如,滞后-1在0.2到0.4范围内的残余自相关,或者说在1.2和1.6之间的Durbin-Watson统计量)表明模型中存在一些微调空间。考虑添加因变量的滞后和/或某些自变量的滞后。或者,如果您的统计软件中有ARIMA +回归程序,请尝试在回归模型中添加AR(1)或MA(1)项。 AR(1)项将因变量的滞后与预测方程相加,而MA(1)项增加预测误差的滞后。如果滞后2存在显着相关性,那么二阶滞后可能是合适的。
如果残差中存在显着的负相关(滞后-1自相关比-0.3更负或DW值大于2.6),请注意您可能对某些变量进行过度分配。差异倾向于在负方向上驱动自相关,而过多的差异可能导致滞后变量无法纠正的负相关的人为模式。
如果在季节性时期存在显着相关性(例如,季度数据滞后4或月度数据滞后12),则表明模型中没有正确考虑季节性。季节性可以通过以下方式之一在回归模型中处理:(i)季节性调整变量(如果它们尚未经过季节性调整),或(ii)使用季节性滞后和/或季节性差异变量(注意:要小心不要超差!),或者(iii)将季节性虚拟变量添加到模型中(即,一年中不同季节的指标变量,例如MONTH = 1或QUARTER = 2等)。虚拟变量方法可以添加季节性调整作为回归模型的一部分进行:可以估算一年中每个季节的不同加性常数。如果已记录因变量,则季节性调整是乘法的。 (需要注意的是:有可能虽然您的因变量已经过季节性调整,但您的某些自变量可能不会,导致其季节性模式泄漏到预测中。)
序列相关的主要情况(Durbin-Watson统计数据远低于1.0,自相关远高于0.5)通常表明模型中存在基本结构问题。您可能希望重新考虑已应用于相关变量和自变量的变换(如果有)。通过差分,记录和/或放气的适当组合来固定所有变量可能会有所帮助。