nvidia-smi和nvidia x服务器设置之间的顺序不同

时间:2018-11-09 13:17:50

标签: ubuntu cuda gpu nvidia pci-e

运行命令nvidia-smi时,我得到了以下两个按其总线ID排序的GPU:

  

对于GPU 0,00000000:0A:00.0

     

对于GPU 1,00000000:41:00.0

但是,当我运行NVIDIA X server Settings时,我可以按照其总线ID排序以下GPU:

  

对于GPU 0,PCI:65:0:0

     

对于GPU 1,PCI:10:0:0

因此,它们根据自己枚举Bus-Id的方式具有不同的顺序。 有什么办法可以使订单保持一致?

OS:Ubuntu 16.04 主板:MSI X399(用于AMD 1950X)

(PS) 实际上,使用dataparallel机制在多个GPU上进行深度学习时,我的计算机被冻结了。我猜这是GPU顺序不同的原因。

1 个答案:

答案 0 :(得分:1)

重要的顺序是CUDA顺序。

您可以enumerate个CUDA设备,看看哪个是哪个。

然后,您可以使用CUDA_VISIBLE_DEVICEScudaSetDevice()cuCtxCreate()

在未用于显示的GPU上运行程序