TensorFlow的数据集API:可变大小的输入

时间:2017-09-22 07:25:41

标签: tensorflow tensorflow-gpu tensorflow-datasets

我将我的整个数据集作为元组列表存储在内存中,其中每个元组对应一批固定大小的N' N' N' N' 。即

(x [i],label [i],length [i])

  • x [i]:numpy形状的数组[N,W,F];这里有N个例子,每个W时间步长;所有时间步长都有固定数量的特征F
  • label [i]:class:shape [N,]批处理中每个示例一个
  • length [i]:数据中的length(次数步数):shape [N,]:这是批处理中每个示例的时间步长(W)

主要问题:批次间的差异很大。

我在查看数据集API的以下examplesdocumentation,但无法理解如何为我的案例创建DataSet对象。 API就像Dataset.from_tensor_slices和Dataset.from_tensor似乎没有工作(抛出广播错误),因为它们要求张量具有相同的形状i,而且W的批次是相同的。有没有办法我可以不必填充我的批次(使用DataSet.padded_batch)?

0 个答案:

没有答案