我想知道以下两段代码之间的区别是什么:
import tensorflow as tf
x = tf.Variable(0, name='x')
model = tf.initialize_all_variables()
with tf.Session() as session:
for i in range(5):
session.run(model)
x = x + 1
print(session.run(x))
import tensorflow as tf
x = tf.Variable(0, name='x')
model = tf.initialize_all_variables()
with tf.Session() as session:
for i in range(5):
x = x + 1
session.run(model)
print(session.run(x))
唯一的区别是" x = x + 1"和" session.run(模型)"。我认为它会对输出产生很大的影响,因为session.run(model)会初始化所有变量。但是,这两个代码块输出相同的东西......
代码是从教程中复制的:http://learningtensorflow.com/lesson2/
答案 0 :(得分:11)
是的,这里有点棘手。 Tensorflow的一个重要概念是延迟评估,这意味着首先构建节点的Tensorflow图,并且仅在session.run上对图进行评估。
对于这行代码x = x + 1,这里的x是Tensor类型,而这里的+是重载的tf.add,所以x = x + 1实际上构建了图形,没有计算发生;并且在每次迭代时,图形(在这种情况下为二叉树)添加一个层(一个嵌套的和)。 session.run(model)将始终将x初始化为0,session.run(x)将根据到目前为止在该迭代中构造的图计算x。例如,在迭代4中,x被加1,持续4次,因为此迭代中的图形有4个嵌套和(或层)。
如果这对你有意义,我认为"两个代码基本相同"也会有意义。
注意:严格来说,在第一次迭代中,右侧的x是Variable类型,但这些是细节,而不是我试图制作的主要观点......