从2016年5月1日至2017年5月31日,每天有96次能耗预测。我正在尝试将R中的ARIMA模型拟合到这些时间序列观测中。我选择时间序列的频率为96.总共有38016个观测值。
我在R中使用tsclean
命令清除了系列,以删除异常值。
timeseries <- ts(full$consumption, frequency = 96)
清理时间序列:
timeseries <- tsclean(timeseries)
然后我对这个系列有所不同:
diffts <- diff(timeseries)
然后我分解了系列以从中获取季节性成分。从中减去季节性成分以延长它。
difftscomponent <- decompose(diffts)
adjusted_diffts <- diffts - difftscomponent$seasonal
最终时间序列的ACF情节:
acf(adjusted_diffts)
最终时间序列的PACF:
pacf(adjusted_diffts)
有三个问题:
通常,ACF的X轴和时间序列的PACF图将显示从1到...的滞后顺序。将有整数值指示滞后的数量。那么为什么在我的情况下有0.1 ......的十进制值?这表明了什么?怎么做才能获得滞后数?
通过查看ACF和PACF情节,我的案例中AR和MA的可能顺序是什么?
3.我已经改变了原始的时间序列,即使其静止并将其延长,以便适合ARIMA模型。通过查看最终调整后的时间序列,是否可以说它适合建模或是否需要进一步转换?
答案 0 :(得分:0)
这是将data.frame
格式化为time.series
的结果。我现在无法测试它,因为我现在无法访问R但是回到一个简单的data.frame
应该可以完成这项任务,一些事情(可能有更优雅的方式) :
acf(data.frame(adjusted_diffts)
虽然绘制的ACF / PACF给出了需要纠正滞后的指示,但ARIMA-Order的选择应该由e完成。 G。检查ARIMA(p,d,q)的多个组合,并选择具有最佳(最低)AIC的组合。 Here是测试不同订单的文章+代码示例。
我无法肯定地回答。我将使用您拥有和之后的数据,拟合ARIMA模型,检查任何剩余结构的残差。如果残差中仍有结构,则可能需要调整数据/模型。
修改:格式化