我正在尝试设计一个python 3 Tensor流LSTM来处理数据集。 我的问题是功能集是一个矩阵 - 8组数字,其中每组是1,2或3个数字。目前我将数据存储为3x8矩阵,其中只有1或2个数字的集合最初的尾随-1(实际数据永远不会低于0)。
e.g。
[
[447, -1, -1]
[147, -1, -1]
[1120, 10, 1111]
[0, 0, -1]
[39, 39, -1]
[2, 0, -1]
[27, 24, -1]
[7, -1, -1]
]
is the same as
[447, 147, [1120, 10, 1111], [0, 0], [39, 39], [2, 0], [27, 24], 7]
我有大约90个这样的时间序列(可以扩展大约3倍),大约150个样本。 我知道我需要将这些数据转换为一组张量,但据我所知,使用(nb_of_samples,seq_len,features),我得到类似(150,90,[3x8])的东西。 我不知道如何将其变成一组可用的张量,或者如果有办法让自己变得更容易。
第一次发帖,很抱歉,如果答案是现有答案的链接,或者我没有提供足够的信息,但我似乎无法通过搜索找到这样的内容。
答案 0 :(得分:0)
更简单的流程: 将功能存储在单个列表中,并保留单独的列表以跟踪功能的名称和顺序。 所以3x8变成1x14,没有尾随的-1值。