我的TensorFlow运行有什么问题cifar10_multi_gpu_train.py

时间:2016-12-29 03:35:46

标签: python tensorflow

我的系统是:

Linux dl1 3.10.0-229.el7.x86_64 #1 SMP Fri Mar 6 11:36:42 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux

和我的GPU:

enter image description here

可以运行像mnistcifar10单GPU版本的样本模型。 所以我认为我的tf安装没问题。

但是,当我跑步时:

python python cifar10_multi_gpu_train.py --num_gpus=4

我收到了这个错误:

  

ValueError:变量conv1 / weights / ExponentialMovingAverage /没有   存在,或者不是用tf.get_variable()创建的。你的意思是设置   在VarScope中重用=无?

1 个答案:

答案 0 :(得分:0)

有什么代码可以看吗? 我个人认为这个问题是由于你没有在不同的gpus中为不同的输入重用共享变量而引起的,检查这行tf.get_variable_scope().reuse_variables()是否在每个gpu的循环中