Numpy矩阵列表作为TensorFlow中的数据集

时间:2017-11-09 00:55:40

标签: numpy tensorflow

有!

我有一个n个30x7矩阵的列表(所以我猜它是一个3D数组)和另一个n个标签列表(基本上是TRUE或FALSE)。如何将其用作TensorFlow的数据集?大多数教程都使用图像,所以我无法找到如何为我的案例做到这一点。

非常感谢!

1 个答案:

答案 0 :(得分:0)

这实际上是一个图像,任何基于图像的教程都应该帮助你。如果您想要关注图片教程,例如卷积神经网络你想要reshape你的30x7矩阵包含1"颜色"渠道。例如:tf.reshape(data_matrix, shape=[30, 7, 1])只会将维度更改为[30, 7, 1],而不会影响数据的实际形状。

如果您将这些批处理在一起,那么您现在将拥有一个大小为[batch_size, 30, 7, 1]的数据集。

现在,您已经获得了正确格式的内容,可以使用卷积网络上的一些教程。

您应该问的更大的问题是,您是否希望将数据视为图像并将卷积网络应用于其中。询问数据的最基本问题是,您期望网络提取的模式是否具有某些2D空间局部性。例如,通过在网络的每一层上通常尺寸为[3×3]或[5×5]的小窗口上寻找图案来有效地处理图像。以这种方式查看数据是否有意义?

如果是这样,伟大的,卷积网络是你的事。如果数据没有任何2D空间意义,那么您可以从简单地将数据展平为[batchsize, 210]大小向量并通过完全连接的神经网络提供它。

或许,矩阵的每一行代表一些数据,并且对1到30行的序列(或者从第1列到第7列的列)进行逻辑排序。如果数据最符合逻辑地表示为行(或列)序列,那么您可能会更好地研究RNN,即循环神经网络,它们可以更有效地对序列进行操作。

无论如何,请查看tf.reshapetf.stack。并且考虑在numpy中完成大部分预处理工作,在numpy中调试总是更容易。