使用所有4个GPU时,Tensorflow的Multi_Gpu_Model导致Ubuntu 18.04操作系统崩溃

时间:2019-02-19 14:03:56

标签: tensorflow nvidia ubuntu-18.04

我正在Ubuntu 18.04 LTS桌面上使用Tensorflow设置Multi-GPU模型。我在4个NVIDIA RTX 2080 TI上运行代码,并使用CPU编译模型。在Windows 10 OS上,相同的代码功能起作用,如果使用Ubuntu,它将崩溃并重新启动系统。我在哪里检查或更改?是操作系统/代码吗?

with tf.device("/cpu:0"):
    model = create_image_model()

# make the model parallel
model = multi_gpu_model(model, gpus=G)

1 个答案:

答案 0 :(得分:1)

尝试将tf.ConfigProto(allow_soft_placement=True)添加到会话或估算器配置中。万一发生这种情况没有帮助的情况,请尝试在UEFI中关闭IOMMU。

https://www.tensorflow.org/guide/using_gpu