我不熟悉时间序列,并使用Rob Hyndman的website每月臭氧浓度数据做一些预测。
在进行对数变换并通过滞后1和12进行差分分别去除趋势和季节性后,我绘制了[在此图像中] [2]显示的ACF和PACF。我是在正确的轨道上,我将如何将其解释为SARIMA?
在PACF情节中,似乎每11个滞后似乎有一个模式,这让我觉得我应该做更多的差异(11个滞后),但这样做会给我带来更糟糕的情节。 我真的很感激你的帮助!
编辑: 我摆脱了滞后1处的差分而只是使用了滞后12,而this就是我为ACF和PACF所得到的。
从那里,我推断:SARIMA(1,0,1)x(1,1,1)(AIC:520.098) 或SARIMA(1,0,1)x(2,1,1)(AIC:521.250) 这将是一个很好的选择,但auto.arima通常给我(3,1,1)x(2,0,0)(AIC:560.7)和(1,1,1)x(2,0,0)( AIC:558.09)没有逐步和近似。
我对使用哪种型号感到困惑,但基于最低的AIC,SAR(1,0,1)x(1,1,1)会是最好的吗?另外,我担心的是没有一个型号通过Ljung-Box测试。有什么办法可以解决这个问题吗?
答案 0 :(得分:1)
手动选择在预测数据集时表现良好的模型订单非常困难。这就是为什么Rob建立了“auto.arima”的原因。在他的R预测包中运行,以找出可能基于某些指标表现最佳的模型。
当你看到一个具有显着负滞后的pacf图时,通常意味着你的数据差异太大。尝试删除第一顺序差异并保持12阶差异。然后继续做出最好的猜测。
我建议尝试使用他的auto.arima函数并将其传递给频率= 12的时间序列对象。他在这里有一个很好的季节性arima模型的写法:
https://www.otexts.org/fpp/8/9
如果您想更深入地了解手动选择SARIMA模型订单,请阅读以下内容:
https://onlinecourses.science.psu.edu/stat510/node/67
回复你的编辑: 如果你澄清你的目标,我认为对这篇文章有益。你想要达到以下哪个目标?
在我看来,#2是最受追捧的目标,所以我认为这是你的目标。根据我的经验,#3产生的样本效果不佳。关于#1,我通常不关心残差中的相关性。我们知道我们没有这个时间序列的真实模型,所以我觉得没有任何理由可以预期样本表现良好的近似模型不会在残差中留下更多的东西也许复杂,或非线性等。
为了向您提供另一个SARIMA结果,我通过我开发的一些代码运行了这些数据,发现以下等式在交叉验证期间产生了最小误差。
Final model is:
SARIMA [0,1,1] [1,1,1]12 with a constant using the log normal of the time-series.
The errors in the cross validation period are:
MAPE = 16%
MAE = 0.46
RSQR = 74%
根据我的理解,这与基于AICc选择方程的方法大致相似,但最终是一种不同的方法。无论如何,如果您的目标超出样本准确度,我建议根据样本外的精确度,样本拟合,测试或绘图来评估方程式。