Question

我知道RNN需要data = (n_samples, n_timestamps, n_features)，但我很难调整数据形状以适应此要求。我见过的RNN的大多数示例（例如，在 Chollets 深度学习书中）都使用一个数据集，其中一个时间戳索引一行，但是对于我的数据集，一个时间戳索引索引多行（请参见下文）。

每个时间戳代表大约14000个样本

通过串联每个时间戳记的值并为它们分配日期键来创建数据集，例如：

df = [[[a], [b]], [[c], [d]] ... ]
dates = ['2018-09-29 05:00:00', '2018-09-29 06:00:00', ... ]

# The dataset comes from 27 timestamps
[In] print(len(df), len(dates))
[Out] 27, 27

# pd being pandas
df = pd.concat(df, keys=pd.to_datetime(dates))

# The data has 24 features
[In] df.shape
[Out] (382393, 24)

但是我想我需要一个这样的形状作为训练集（用于27个时间戳）：

(~14000, 27, 24)

每个时间步代表一个〜14000行的步。

我对python还是很陌生，不知道如何实现它以最终训练递归神经网络。对于我应如何处理此数据集以适合RNN的任何指导，我们将不胜感激。

如何重塑此数据集以适合RNN

0 个答案: