我的系统是:
Linux dl1 3.10.0-229.el7.x86_64 #1 SMP Fri Mar 6 11:36:42 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux
和我的GPU:
可以运行像mnist
和cifar10
单GPU版本的样本模型。
所以我认为我的tf安装没问题。
但是,当我跑步时:
python python cifar10_multi_gpu_train.py --num_gpus=4
我收到了这个错误:
ValueError:变量conv1 / weights / ExponentialMovingAverage /没有 存在,或者不是用tf.get_variable()创建的。你的意思是设置 在VarScope中重用=无?
答案 0 :(得分:0)
有什么代码可以看吗?
我个人认为这个问题是由于你没有在不同的gpus中为不同的输入重用共享变量而引起的,检查这行tf.get_variable_scope().reuse_variables()
是否在每个gpu的循环中