我有一个数据集,其中包含主题,时间步长(t)和在时间t的每个主题的一系列信息。特别是:
SujbectID time A B C D E
1 1 1 2 1 3 4
1 2 1 2 5 2 4
2 1 0 4 5 3 4
2 2 1 2 1 3 4
2 3 1 6 0 3 4
3 1 1 7 4 3 4
如您所见,每个主题注册的时间步数(=每个主题的行数)可能会有所不同。
此刻,我将数据作为熊猫数据框上传,但需要时可以使用其他任何格式。
我想做的就是操纵这个数据集,将其转换为可以提供给Keras中实现的RNN的格式。意思是我想为每个主题设置一个向量序列(在时间t,t + 1,t + 2等处),其中包含A,B,C,D,E中的信息。我猜所有对象的时间步数应该相等,因此应该执行某种填充操作...但是不幸的是,我刚开始时陷入困境,无法理解Keras在向量序列上需要哪种格式,以及如何正确重塑数据。
我希望我能说清楚自己...有什么主意吗?