使用Keras和Tensorflow指定要使用的3个GPU(在一台机器中有4个)

时间:2019-03-20 15:26:45

标签: python tensorflow keras gpu

我正在具有4个GPU的机器上进行深度学习。在训练期间,第三个GPU始终丢失(错误出现“ GPU丢失”,并且日志表明它是该特定GPU)。我假设它是一个散热问题,而GPU不再固定。

在解决此硬件问题之前,我想继续使用3个GPU('/ gpu:0','/ gpu:1','/ gpu:3')。在Keras中,有没有一种方法可以具体指定我要使用的GPU(或者忽略'/ gpu:2')?

我在指定GPU与CPU使用率以及在多GPU机器上指定一个GPU上看到了很多东西,但是没有看到这个特定问题(隔离了多个特定GPU)。非常感谢。

1 个答案:

答案 0 :(得分:2)

您可以尝试在CUDA_VISIBLE_DEVICES环境中使用

import os
os.environ['CUDA_VISIBLE_DEVICES']="0,1,3"

可能在导入keras / tf之前进行设置。