Question

我正在尝试使用ARIMA模型预测时间序列中的下一个值。这是我的代码：（很抱歉输入错误）

split_val = floor(len(data_file)*0.8)
train = data_file[["Daily Confirmed"]][:split_val]
tesst = data_file[["Daily Confirmed"]][split_val:]

print(train.head())
print(tesst.head())

p = d = q = range(1, 5)

pdq = list(itertools.product(p, d, q))
# print(pdq)
bestvalues = {}
for i in pdq:
    try:
        p, d, q = i
        moodel = ARIMA(train, order=(p, d, q))
        trained_model = moodel.fit()
        bestvalues[trained_model.aic] = i
        print(trained_model.aic, " ", i)
    except:
        continue

print(bestvalues)
minaic = min(bestvalues.keys())


moodel = ARIMA(train, order=bestvalues[minaic])
trained_model = moodel.fit()

pridiction = trained_model.forecast(steps=len(tesst))[0]

comparisionn = tesst.copy()

comparisionn["forcastted"] = pridiction.tolist()
comparisionn.plot()

print(comparisionn)
print(trained_model.aic)
plt.show()

（数据已经过预处理）

我可以获得的最小aic是2145.930883796257，这是针对测试数据的预测（仅前5个）：

            Daily Confirmed    forcastted
Date                                     
2020-06-22            13560  15048.987970
2020-06-23            15656  15349.247935
2020-06-24            16868  15905.260648
2020-06-25            18205  16137.086959
2020-06-26            18255  16237.232886

这是情节

如您所见，预测并不准确，我将p，d和q的所有值都强行强加到4。...

可能是什么问题？谢谢。

Answer 1

如果“每日”更新模型，应该会获得更好的结果。您的模型可能在8月14日之后没有看到7月21日之后的任何数据。 ARIMA可能很难预测20-30步。相反，请尝试逐步进行预测，如下所示：

history_endog = list(train.copy(deep=True))
y_true = []
y_pred = []

for obs in test: 
    model = ARIMA(endog=history_endog, order=(p,d,q))
    model_fit = model.fit()
    forecast = model_fit.forecast()[0]

    y_true.append(obs)
    y_pred.append(forecast)
    history_endog.append(obs)

然后绘制y_true和y_pred，您的结果将得到改善。为了简单起见，上面的代码示例使用列表。

ARIMA模型不准确的预测

1 个答案: