使用Tensorflow从csv文件加载图像和标签

时间:2016-05-12 22:16:14

标签: python csv tensorflow

我今天早上一直试图让TensorFlow io api工作。

经过一番研究,我设法读取了数据,但在出列时我无法正确绑定图像和标签。

这是我写的代码:

# load csv content
csv_path = tf.train.string_input_producer(['list1.csv', 'list2.csv'])
textReader = tf.TextLineReader()
_, csv_content = textReader.read(csv_path)
im_name, label = tf.decode_csv(csv_content, record_defaults=[[""], [1]])

# load images
im_content = tf.read_file(im_dir+im_name)
image = tf.image.decode_png(im_content, channels=3)
image = tf.cast(image, tf.float32) / 255.
image = tf.image.resize_images(image, 640, 640)

# make batches
im_batch, lb_batch = tf.train.batch([image, label], batch_size=batch)

im_batchlb_batch的顺序混乱(图像绑定到随机标签)。

知道发生了什么事吗?感谢。

1 个答案:

答案 0 :(得分:5)

您列出的代码没有问题。

im_batch, lb_batch = tf.train.batch([image, label], batch_size=batch)

上面的行将图像和标签绑定到同一个队列,因此无论何时对im_batch或lb_batch执行操作,队列都会从另一个队列中弹出批量数据单元。 所以常见的错误可能是分别调用im_batch.eval()和lb_batch.eval():

# this is wrong
images = im_batch.eval()
labels = lb_batch.eval()

在调用im_batch.eval()之后,lb_batch也会弹出相同数量的数据单元,因为它们绑定在一个队列中。因此,当接下来调用lb_batch.eval()时,它实际上会给出下一批的标签。

正确的方法是将im_batch和lb_batch放入单元操作中,可以是graph或sess.run()操作列表:

  1. 这是正确的

    loss = your_network_model(im_batch,lb_batch) loss.eval()

  2. 2

    # this is correct
    images, labels = sess.run([im_batch, lb_batch])