我有一个数据集,其中包含每日2016年1月1日至2017年11月7日当天(日期)的能源使用情况。其中一个字段是非工作日(nwd)的标志,值为0和1表示这是否是工作日。
数据结构如下: -
Date,usage,avgtemp,nwd
2016-01-01,28.5,105986,1
2016-01-02,29.2,105548,1
.
.
.
2017-11-07,98457,23.5,0
我用这些值创建了一个数据框 - 没有问题。然后我创建了另外两个数据框,一个是nwd = 1,另一个是nwd = 1,分别用于非工作日和工作日的数据集。
我正在尝试为这两个数据帧中的每一个生成一个时间序列(使用zoo或xts包 - 我对任何一个开放),这样我就可以对它们进行非平稳性测试(adf / pp)然后进行arima建模以建立使用的预测模型。
我可以对数据不是很规律的数据集使用时间序列,因为这些系列中的每一个都会有间隙 - 如果中间有假期,工作日系列可能在一周内连续不到5天。这同样适用于非工作日系列。
我无法在每周一级对此进行总结,因为我需要在每日水平预测它们,并且可能在随后的半小时水平预测它们。我甚至可能想做#ardl'稍后使用' avgtemp'进行建模作为回归者之一。
P.S。 找到一个在某种程度上类似于我的帖子,但我似乎无法根据那里的回答得到它: -