我在tensorflow平台上训练我的模型,但是遇到了一些问题。 一个形状为[6000000,128]的变量,其大小大于20G,我的机器有6个GPU,每个GPU具有11G内存。我可以在两个GPU上放一个变量吗?如果是,该怎么做。
答案 0 :(得分:0)
多个GPU
以下代码允许操作在多个GPU上运行。我们使用3个GPU来计算3个单独的矩阵乘法。每个乘法都会生成一个2x2矩阵。然后,我们使用CPU对矩阵执行逐元素求和。
H13
您可以参考此以获取更多详细信息https://www.tensorflow.org/guide/using_gpu