我正在使用SARIMA方法来预测大量时间序列(约10000个)。在Python中,pyramid
模块提供了auto_arima
,可以像这样使用
from pyramid.arima import auto_arima
stepwise_model = auto_arima(train, start_p=1, start_q=1,
max_p=3, max_q=3, m=12,
start_P=0, seasonal=True,
d=1, D=1, trace=True,
error_action='ignore',
suppress_warnings=True,
stepwise=True)
stepwise_model.fit(train)
future_forecast = stepwise_model.predict(n_periods=test.shape[0])
在某些时间序列上,效果很好,就像这个:
但是某些时间序列并不是真正的“可预测”,因此SARIMA方法不起作用:
将“可预测”数据与“不可预测”数据区分开并仅在第一组上使用SARIMA算法或修改SARIMA算法以改善预测的策略是什么?