我今天早上一直试图让TensorFlow io api工作。
经过一番研究,我设法读取了数据,但在出列时我无法正确绑定图像和标签。
这是我写的代码:
# load csv content
csv_path = tf.train.string_input_producer(['list1.csv', 'list2.csv'])
textReader = tf.TextLineReader()
_, csv_content = textReader.read(csv_path)
im_name, label = tf.decode_csv(csv_content, record_defaults=[[""], [1]])
# load images
im_content = tf.read_file(im_dir+im_name)
image = tf.image.decode_png(im_content, channels=3)
image = tf.cast(image, tf.float32) / 255.
image = tf.image.resize_images(image, 640, 640)
# make batches
im_batch, lb_batch = tf.train.batch([image, label], batch_size=batch)
im_batch
和lb_batch
的顺序混乱(图像绑定到随机标签)。
知道发生了什么事吗?感谢。
答案 0 :(得分:5)
您列出的代码没有问题。
im_batch, lb_batch = tf.train.batch([image, label], batch_size=batch)
上面的行将图像和标签绑定到同一个队列,因此无论何时对im_batch或lb_batch执行操作,队列都会从另一个队列中弹出批量数据单元。 所以常见的错误可能是分别调用im_batch.eval()和lb_batch.eval():
# this is wrong
images = im_batch.eval()
labels = lb_batch.eval()
在调用im_batch.eval()之后,lb_batch也会弹出相同数量的数据单元,因为它们绑定在一个队列中。因此,当接下来调用lb_batch.eval()时,它实际上会给出下一批的标签。
正确的方法是将im_batch和lb_batch放入单元操作中,可以是graph或sess.run()操作列表:
loss = your_network_model(im_batch,lb_batch) loss.eval()
2
# this is correct
images, labels = sess.run([im_batch, lb_batch])