最近我一直在处理时间序列数据。进行了很多研究,但还没有找到负责这个(非常基本)问题的人。
说,我有从t=8
到t=50
期间的数据。我使用的是滞后1,2和7,因为这是每日数据,因此我需要进行7天的预测。因此,我使用从t=8
到t=43
的数据训练模型,以预测从t=44
到t=50
的数据。
所以,我的火车数据如下:
t Q Q_lag1 Q_lag2 Q_lag7
8 10 11 12 9
9 14 10 11 8
. . . . .
. . . . .
. . . . .
43 25 24 22 20
这里没问题。我可以训练模型,Q为y_train
,其余列为X_train
。但是然后,如果我想测试模型以进行预测,是否可以执行以下操作:
forecast= clf.predict(X_test)
我将使用实际上不知道的数据。
说,要预测t=48
中的Q值,我需要来自滞后1,滞后2和滞后7的数据,分别是t=47
,t=46
和{{1} },但实际上,我只有t=40
之前的数据,这意味着我需要使用t=43
和t=47
的预测,而不是实际值。
这应该是相当标准的,但是找不到解决这个问题的人。您知道如何将我的X_test数据递归替换为预测吗?