时间序列预测:用于交叉验证的训练数据的大小

时间:2018-06-21 09:40:18

标签: tensorflow keras time-series cross-validation forecasting

从这里继续上一个主题:

Keras LSTM: a time-series multi-step multi-features forecasting - poor results

我想问您有关找到正确网络的策略。我已经读了很多有关“测试和跟踪”以及“没有规则来设置隐藏神经元的正确大小的规则”的内容。”另一方面,例如,我们有一种k折方法来确定某些网络参数。

问题是如何为k折或其他任何方法选择足够的输入数据以使我的实验在合理的时间内完成?应该是整个数据还是部分数据?如果是一部分,那么什么尺寸合适?

这是我的输入数据集描述:

我有一个时间序列数据集,其中包含来自全年的数据(日期是索引)。每15分钟(一年中)对数据进行一次测量,每天得出96个时间步。数据已经标准化。变量是相关的。除了VAR以外的所有变量都是气象测量。

VAR在一天和一周的时间内是季节性的(因为周末看起来有所不同,但每个周末都更少)。 VAR值是固定的。 我想预测接下来两天(提前192步)和接下来7天(提前672步)的VAR值。

这是数据集的样本:

DateIdx               VAR       dewpt       hum         press       temp
2017-04-17 00:00:00   0.369397  0.155039    0.386792    0.196721    0.238889
2017-04-17 00:15:00   0.363214  0.147287    0.429245    0.196721    0.233333
2017-04-17 00:30:00   0.357032  0.139535    0.471698    0.196721    0.227778
2017-04-17 00:45:00   0.323029  0.127907    0.429245    0.204918    0.219444
2017-04-17 01:00:00   0.347759  0.116279    0.386792    0.213115    0.211111
2017-04-17 01:15:00   0.346213  0.127907    0.476415    0.204918    0.169444
2017-04-17 01:30:00   0.259660  0.139535    0.566038    0.196721    0.127778
2017-04-17 01:45:00   0.205564  0.073643    0.523585    0.172131    0.091667
2017-04-17 02:00:00   0.157650  0.007752    0.481132    0.147541    0.055556
2017-04-17 02:15:00   0.122101  0.003876    0.476415    0.122951    0.091667

Input dataset plot

0 个答案:

没有答案