Tensorflow迭代器返回元组的问题

时间:2019-05-08 18:59:08

标签: python numpy tensorflow tuples tensorflow-datasets

我想遍历TF数据集,以便将获得的数据转换为numpy张量。对于tensorflow来说,这是我的新代码

  def convert_dataset_to_pytorch(self, dataset):
    sess = tf.Session(config=self.config)

    iterator = dataset.make_one_shot_iterator()
    exampleTF, labelsTF = iterator.get_next()

    examples = torch.Tensor()
    labels = torch.Tensor()

    try:
      while True:
        examples = torch.cat((examples,torch.Tensor(exampleTF.eval(session=sess))),0)
        labels = torch.cat((labels,torch.Tensor([labelsTF.eval(session=sess)])),0)
    except tf.errors.OutOfRangeError:
      pass

    return examples, labels

一个明显的问题是,每次对eval()的调用都会同时遍历exampleTF和labelsTF,从而跳过了一半的条目。有什么帮助吗?我也尝试过类似的

  def convert_dataset_to_pytorch(self, dataset):
    sess = tf.Session(config=self.config)

    iterator = dataset.make_one_shot_iterator()
    next_element = iterator.get_next()

    examples = torch.Tensor()
    labels = torch.Tensor()

    try:
      while True:
        sess.run(next_element)
        examples = torch.cat((examples,torch.Tensor(next_element[0])),0)
        labels = torch.cat((labels,torch.Tensor([next_element[0]])),0)
    except tf.errors.OutOfRangeError:
      pass

    return examples, labels

但这只会导致形式错误

examples = torch.cat((examples,torch.Tensor(next_element[0])),0)
TypeError: object of type 'Tensor' has no len()

1 个答案:

答案 0 :(得分:0)

不确定当您想要的只是一个numpy张量时,为什么要在tensorflow中创建pytorch张量。回答您的问题(如下所述)

  

对TF数据集进行迭代,以将获得的数据转换为   numpy张量。

示例代码:

import numpy as np

inc_dataset = tf.data.Dataset.range(100)
dec_dataset = tf.data.Dataset.range(0, -100, -1)
dataset = tf.data.Dataset.zip((inc_dataset, dec_dataset))

iterator = dataset.make_one_shot_iterator()
next_element = iterator.get_next()

result = list()
with tf.Session() as sess:
    try:
        while True:
          result.append(sess.run(next_element)) 
    except tf.errors.OutOfRangeError:
          pass

examples = np.array(list(zip(*result))[0])
labels = np.array(list(zip(*result))[1])

现在,您可以将exampleslabels np数组转换为pytorch或tensorflow张量或所需的任何张量。