您如何模拟假期前后季节性变化的零售额?

时间:2019-04-02 21:51:21

标签: python time-series statsmodels forecasting

我正在python中使用statsmodels来预测沃尔玛kaggle数据集的每周零售额。在通过SARIMA运行之前,我很难实现平稳。问题在于复活节可能与每年相隔数周。您如何为假期中的这些波动建模?

我尝试对最好的(p,d,q)(P,D,Q)m参数进行网格搜索。我的网格搜索返回了(0,1,0)(0,2,0)52的SARIMA,AIC为832,但是在绘制时显然明显歪斜了(这是可以预期的,因为我的数据实际上并未通过这些转换实现平稳)。

有人建议零售季节使用SARIMAX吗?我知道R包比较好,但是我不知道R,希望没有它我也可以解决。

p, d, q = 0, 1, 0
P, D, Q, m = 0, 2, 0, 52

model = SARIMAX(train11.Weekly_Sales.asfreq('W-FRI'), order=(p,d,q), seasonal_order=(P,D,Q,m),
                trend='n', enforce_stationarity=False, enforce_invertibility=False)
model_fit = model.fit()
model_fit.summary()
==========================================================================================
Dep. Variable:                       Weekly_Sales   No. Observations:                  143
Model:             SARIMAX(0, 1, 0)x(0, 2, 0, 52)   Log Likelihood                -415.101
Date:                            Tue, 02 Apr 2019   AIC                            832.202
Time:                                    21:48:24   BIC                            833.813
Sample:                                02-05-2010   HQIC                           832.770
                                     - 10-26-2012                                         
Covariance Type:                              opg                                         
==============================================================================
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
sigma2      2.202e+08   1.77e+07     12.406      0.000    1.85e+08    2.55e+08
===================================================================================
Ljung-Box (Q):                       28.96   Jarque-Bera (JB):                77.77
Prob(Q):                              0.79   Prob(JB):                         0.00
Heteroskedasticity (H):               0.00   Skew:                            -1.44
Prob(H) (two-sided):                  0.00   Kurtosis:                         9.49
===================================================================================

1 个答案:

答案 0 :(得分:0)

最简单的方法是将假变量用于假期和特殊事件。 SARIMAX允许在exog中指定其他解释性变量。

如果有足够的时间来估计例如复活节效应,则虚拟变量可以是特定日期,或者可以在同一个虚拟变量中组合几个假期,例如圣诞节前几个周末的购物量比平时高得多

SARIMA本身将无法捕获像复活节这样的效果,因为即使是一年的季节性假期,假期也不会具有固定的周期长度。