TensorFlow shuffle_batch无效

时间:2016-03-01 04:43:02

标签: tensorflow

import tensorflow as tf
sess = tf.Session()

def add_to_batch(image):

    print('Adding to batch')
    image_batch = tf.train.shuffle_batch([image],batch_size=5,capacity=11,min_after_dequeue=1,num_threads=1)

    # Add to summary
    tf.image_summary('images',image_batch)

    return image_batch

def get_batch():

    # Create filename queue of images to read
    filenames = [('/media/jessica/Jessica/TensorFlow/Practice/unlabeled_data_%d.png' % i) for i in range(11)]
    filename_queue = tf.train.string_input_producer(filenames)
    reader = tf.WholeFileReader()
    key, value = reader.read(filename_queue)

    # Read and process image
    my_image = tf.image.decode_png(value)
    my_image_float = tf.cast(my_image,tf.float32)
    image_mean = tf.reduce_mean(my_image_float)
    my_noise = tf.random_normal([96,96,3],mean=image_mean)
    my_image_noisy = my_image_float + my_noise
    print('Reading images')

    return add_to_batch(my_image_noisy)

def main ():

    sess.run(tf.initialize_all_variables())
    tf.train.start_queue_runners(sess=sess)
    writer = tf.train.SummaryWriter('/media/jessica/Jessica/TensorFlow/Practice/summary_logs', graph_def=sess.graph_def)
    merged = tf.merge_all_summaries()
    images = get_batch()
    summary_str = sess.run(merged)
    writer.add_summary(summary_str)

您好,

我正在尝试在TensorFlow中构建一个简单的神经网络。我试图批量加载我的输入图像。现在我用11张图片和batch_size = 5测试代码。最后我将使用100000张图片。

这段代码是从TensorFlow的cifar10.py示例中修改的。出于某种原因,我的代码在tf.train.shuffle_batch([image],batch_size=5,capacity=1,min_after_dequeue=1,num_threads=1)

停止(不会终止,只是挂起)

我尝试过不同的batch_size,capacity,min_after_dequeue等组合,但我仍然无法弄清楚出了什么问题。

任何帮助将不胜感激!谢谢!

1 个答案:

答案 0 :(得分:7)

看起来问题出现是因为声明

tf.train.start_queue_runners(sess=sess)

...在创建任何队列运行程序之前执行。如果您在images = get_batch()之后移动此行,则您的程序应该可以正常工作。

这是什么问题? tf.train.shuffle_batch()函数在内部使用tf.RandomShuffleQueue生成随机批次。目前,将元素放入该队列的唯一方法是运行调用q.enqueue()操作的步骤。为了简化这一过程,TensorFlow在构建图表时隐式收集了"queue runners"的概念,然后通过调用tf.train.start_queue_runners()开始。但是,调用tf.train.start_queue_runners()仅启动已在该时间点定义的队列运行程序,因此必须 后创建队列运行程序的代码。