我只是想知道我们是否有一个模型将时间序列预测(例如预测未来销售)这两个因素都考虑在内。
问题在于,如果我们使用的是ARIMA之类的东西,那么它就不会考虑重要信息(例如公司添加的新促销活动或其他因素,例如产品类型等)。
另一方面,如果我使用的是随机森林之类的机器学习模型,那么我会丢失趋势和季节性的信息。
我们有结合两者的东西吗?
答案 0 :(得分:1)
除了时间序列数据本身之外,ARIMA模型还可以获取其他信息。这些称为因果变量或外生变量。请参阅ARMAX和ARIMAX模型。
使用指数平滑类型的模型(Holt,Holt-Winters等)要复杂一些。
机器学习模型也可以用于时间序列数据,您只需要以正确的方式格式化数据即可。
对于传统的时间序列模型,数据如下所示:
Train Test
[1, 2, 3], [4]
[1, 2, 3, 4], [5]
[1, 2, 3, 4, 5], [6]
[1, 2, 3, 4, 5, 6], [7]
您可以重新格式化数据,使其看起来像监督学习问题:
Train: [1, 2, 3 | 4]
[2, 3, 4 | 5]
[3, 4, 5 | 6]
-----------------------
Test: [4, 5, 6 | 7]
您可以应用大多数受监督的ML方法。 但是请注意,对于ML模型,时间序列输入将始终是固定的滞后时间(与诸如指数平滑的顺序模型相比)。