我正在尝试使用
的洛杉矶交通都会数据进行时间序列预测https://github.com/liyaguang/DCRNN的数据metr-la.h5数据。
到目前为止,我已经阅读了hdf文件,并试图思考如何拆分训练,验证和测试数据。
我对ML很陌生,所以对于分析数据的步骤感到很困惑。
据我了解并读取数据,
我有一系列带有未知行变量的时间索引。我是否应该先选择一个列并分析数据?
如果要使用LSTM进行时间序列预测,应该如何首先分割数据?
我知道LSTM可以通过简单的顺序LSTM函数来应用,但是对于如何拆分数据和执行K倍交叉验证感到困惑,因为这是我第一次处理h5文件而不是csv。
谢谢!