from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)
import tensorflow as tf
sess = tf.InteractiveSession()
x = tf.placeholder(tf.float32, shape=[None, 784])
y_ = tf.placeholder(tf.float32, shape=[None, 10])
def weight_variable(shape):
initial = tf.truncated_normal(shape, stddev=0.1)
return tf.Variable(initial)
def bias_variable(shape):
initial = tf.constant(0.1, shape=shape)
return tf.Variable(initial)
def conv2d(x, W):
return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')
def max_pool_2x2(x):
return tf.nn.max_pool(x, ksize=[1, 2, 2, 1],
strides=[1, 2, 2, 1], padding='SAME')
W_conv1 = weight_variable([5, 5, 1, 32])
b_conv1 = bias_variable([32])
x_image = tf.reshape(x, [-1, 28, 28, 1])
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1)
W_conv2 = weight_variable([5, 5, 32, 64])
b_conv2 = bias_variable([64])
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)
W_fc1 = weight_variable([7 * 7 * 64, 1024])
b_fc1 = bias_variable([1024])
h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)
keep_prob = tf.placeholder(tf.float32)
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)
W_fc2 = weight_variable([1024, 10])
b_fc2 = bias_variable([10])
y_conv = tf.matmul(h_fc1_drop, W_fc2) + b_fc2
cross_entropy = tf.reduce_mean(
tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y_conv))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
for i in range(20000):
batch = mnist.train.next_batch(50)
if i % 100 == 0:
train_accuracy = accuracy.eval(feed_dict={
x: batch[0], y_: batch[1], keep_prob: 1.0})
print('step %d, training accuracy %g' % (i, train_accuracy))
train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})
print('test accuracy %g' % accuracy.eval(feed_dict={
x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))
以上是直接来自https://www.tensorflow.org/versions/r1.3/get_started/mnist/pros
的多层卷积神经网络的代码我一直试图获取h_conv1和h_conv2中的值,并且我尝试过使用
get_value = h_conv1.eval() or h_conv1.eval(session=sess)
两者都不成功,我甚至尝试在h_conv1中设置名称并使用
获取它h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1, name='example')
test = tf.get_default_graph().get_tensor_by_name("example:0")
但它仍然没有成功。 但是,使用
提取W_conv1的值很容易weights = W_conv1.eval()
它会在Spyder的变量资源管理器中显示为一个numpy数组,我可以用它做任何我想做的事。
我想知道是否有其他方法可以获取h_conv1值,因此我可以在将这些值提供给下一个操作之前对这些值执行一些处理步骤。
答案 0 :(得分:0)
如果您遇到了我期望的问题,问题是您成功打印的权重是张量流变量(意味着它们的值存储为会话的一部分),但h_conv1是一个操作,意味着它有一个输出定义为其输入的函数。由于这些输入最终路由回占位符变量,并且在评估操作时没有给出任何占位符变量,因此它会因InvalidArgumentOperation而失败。
我猜测你正在寻找的是上次运行训练操作时输出的值。为此,我开始工作的方法只是将Ω(f(n))
操作附加到该节点,然后在我运行训练操作的同时对其进行评估。所以在你的图表定义中你有这样的东西:
ϴ(f(n))
然后替换这一行:
tf.Print
这一行:
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_conv1_printop = tf.Print(h_conv1, [h_conv1])
基本上,将打印Op附加到要查看其输出的relu Op,然后在运行会话的其余部分的同时评估该Op,以便使用该值填充它。
希望这有意义并解决您的问题,总是有助于审核graphs and sessions上的文档,因为这是一个常见的混淆点。