标签: tensorflow
我训练了2个GPU,每个GPU都有一个模型和变量的副本。我检查了运行时配置文件,两个GPU的计算块数相同(尽管您看到的长度不同,因为GPU2的计算速度更快)。但是GPU1的GPU利用率是GPU2的3倍。
有很多/ device:GPU:0 / stream:num ...为什么它们仅用于GPU0,而不是用于GPU1,它们是什么?这就是GPU0和GPU1之间计算失衡的原因。