在Tensor中,我不理解Variable的值。下面是我的代码,我想我做了
sess.run()
应该计算 W 的值,然而,在打印之后,我发现它没有改变。
代码是来自TensorFlow网站的MNIST示例代码。任何人都可以解释为什么 W 不会改变?
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
mnist = input_data.read_data_sets("MNIST_dat/",one_hot=True)
x= tf.placeholder(tf.float32,[None,784])#need input x
W= tf.Variable(tf.zeros([784,10]))
b= tf.Variable(tf.zeros([10]))
y= tf.nn.softmax(tf.matmul(x,W)+b)
y_= tf.placeholder(tf.float32,[None,10])#need input y
cross_entropy = tf.reduce_mean(-tf.reduce_mean(y_*tf.log(y),reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for i in range(1000):
batch_xs,batch_ys = mnist.train.next_batch(100)
sess.run(train_step,feed_dict={x:batch_xs,y_:batch_ys})
ww=W.eval(sess)
print(ww)
答案 0 :(得分:2)
好的,当我运行你的代码时,我得到的输出看起来像这样
[[ 0. 0. 0. ..., 0. 0. 0.] [ 0. 0. 0. ..., 0. 0. 0.] [ 0. 0. 0. ..., 0. 0. 0.] ..., [ 0. 0. 0. ..., 0. 0. 0.] [ 0. 0. 0. ..., 0. 0. 0.] [ 0. 0. 0. ..., 0. 0. 0.]]
但是你必须意识到,W是一个100个元素的784,这个显示只显示了开始和结束时的几个值。对于MNIST中的大多数图像,第一个和最后几个像素不会很重要(实际的重要数据位于中间的某个位置,其中绘制了实际数字,对吧?)。但是,如果我将print语句更改为
print(ww.min(), ww.max())
我得到了这个输出
-0.330358 0.429428
这意味着正在按照预期训练一些重量。