我知道RNN需要data = (n_samples, n_timestamps, n_features)
,但我很难调整数据形状以适应此要求。我见过的RNN的大多数示例(例如,在 Chollets 深度学习书中)都使用一个数据集,其中一个时间戳索引一行,但是对于我的数据集,一个时间戳索引索引多行(请参见下文)。
每个时间戳代表大约14000个样本
通过串联每个时间戳记的值并为它们分配日期键来创建数据集,例如:
df = [[[a], [b]], [[c], [d]] ... ]
dates = ['2018-09-29 05:00:00', '2018-09-29 06:00:00', ... ]
# The dataset comes from 27 timestamps
[In] print(len(df), len(dates))
[Out] 27, 27
# pd being pandas
df = pd.concat(df, keys=pd.to_datetime(dates))
# The data has 24 features
[In] df.shape
[Out] (382393, 24)
但是我想我需要一个这样的形状作为训练集(用于27个时间戳):
(~14000, 27, 24)
每个时间步代表一个〜14000行的步。
我对python还是很陌生,不知道如何实现它以最终训练递归神经网络。对于我应如何处理此数据集以适合RNN的任何指导,我们将不胜感激。