我正在尝试拟合ARIMA模型。我有3个月的数据,每分钟显示count(float)
。 arima.fit()
我应该通过哪个顺序?
我需要预测每一分钟。
答案 0 :(得分:0)
基本的ARIMA(p,d,q)模型无法处理您的数据。
您的数据违反了ARIMA的假设,其中之一是参数必须随时间保持一致。
我看到5个峰值的簇,所以我假设您有5个繁忙的工作日和安静的周末。基本ARIMA不会知道工作日和周末之间的区别,因此它可能不会给您带来有用的结果。
存在诸如SARIMA(季节性自回归综合移动平均线)之类的东西。如果您要处理每日数据点,但对真正的分钟数据也不适合,那么这将很有用。
我建议您尝试过滤数据,以便排除晚上和周末。然后,您可能正在处理具有一致参数的数据集。如果您使用的是python,则可以尝试对过滤的时间序列数据使用pyramid的auto_arima()函数,以使其尝试自动查找最佳参数p,d,q。
对于这种类型的分析,它还会执行很多统计测试。实际上,我并不总是同意auto_arima的参数选择,但这只是一个开始。
model = pyramid.arima.auto_arima(s)
print(model.summary())
http://pyramid-arima.readthedocs.io/en/latest/_submodules/arima.html
答案 1 :(得分:0)
1)您的数据是否还适合盒子-Jenkins模型(ARIMA)?
2)我最终看到了更高的均值。数据中有明显的季节性。 ARIMA将失败。请尝试基于季节性的模型-尝试严格建议的SARIMA,Prophet是Facebook针对季节性的另一个漂亮算法。 -(R实作)
https://machinelearningstories.blogspot.com/2017/05/facebooks-phophet-model-for-forecasting.html
3)不仅依赖ARIMA。尝试其他时间序列算法,例如STL,BTS,TBATS。 (结构时间序列)和混合动力等。请问您是否需要R中的某些包装信息?