我有多个部门(零售领域)的每周时间序列数据,并且根据一些研究,我正在自动为每个时间序列查找模型参数的过程。到目前为止,我已经在for循环中为每个时间序列实现了以下模型:
1)ARIMA(R中的auto.arima)
2)stlf(由于我有每周数据,因此无法使用R的ets函数)
3)TBATS
4)对ARIMA错误进行回归(使用傅立叶项)
5)基线模型:天真和均值
我想了解如何为每个时间序列选择模型。我对此有多种方法:
1)选择测试数据具有最低RMSE的模型(风险:测试数据过拟合)
2)在时间序列(tsCV)的交叉验证中,选择具有最低RMSE的最佳模型
3)在所有时间序列中选择一个模型族,根据该模型族在所有时间序列中给出的平均RMSE得分最低。
有什么方法可以改善我的方法?以上任何方法有什么缺点?有更好的方法吗?
非常感谢!
答案 0 :(得分:1)
使用上述所有预测方法预测数据,然后计算MAPE并检查哪个模型给出了最佳结果,然后使用该模型来预测数据。 另外,请尝试检查输入数据的不同数据转换,例如log,inverse等。