如何重塑此数据集以适合RNN

时间:2019-04-03 09:12:47

标签: python pandas recurrent-neural-network

我知道RNN需要data = (n_samples, n_timestamps, n_features),但我很难调整数据形状以适应此要求。我见过的RNN的大多数示例(例如,在 Chollets 深度学习书中)都使用一个数据集,其中一个时间戳索引一行,但是对于我的数据集,一个时间戳索引索引多行(请参见下文)。

enter image description here

每个时间戳代表大约14000个样本

通过串联每个时间戳记的值并为它们分配日期键来创建数据集,例如:

df = [[[a], [b]], [[c], [d]] ... ]
dates = ['2018-09-29 05:00:00', '2018-09-29 06:00:00', ... ]

# The dataset comes from 27 timestamps
[In] print(len(df), len(dates))
[Out] 27, 27

# pd being pandas
df = pd.concat(df, keys=pd.to_datetime(dates))

# The data has 24 features
[In] df.shape
[Out] (382393, 24)

但是我想我需要一个这样的形状作为训练集(用于27个时间戳):

(~14000, 27, 24)

每个时间步代表一个〜14000行的步。

我对python还是很陌生,不知道如何实现它以最终训练递归神经网络。对于我应如何处理此数据集以适合RNN的任何指导,我们将不胜感激。

0 个答案:

没有答案