torch.cuda.is_avaiable返回False,而nvidia-smi不起作用

时间:2020-08-09 10:19:27

标签: docker gpu nvidia torch

我正在尝试构建可以使用GPUS运行的docker映像,这是我的情况: situation inside docker images

我有python 3.6,我从图像nvidia / cuda:10.0-cudnn7-devel开始。 火炬看不到我的GPU。

nvidia-smi也不起作用,返回错误:

> Failed to initialize NVML: Unknown Error
> The command '/bin/sh -c nvidia-smi' returned a non-zero code: 255

我安装了nvidia工具包和nvidia-smi,

 RUN apt install nvidia-cuda-toolkit -y
 RUN apt-get install nvidia-utils-410 -y

1 个答案:

答案 0 :(得分:1)

我发现问题是您在构建期间无法使用nvidia-smi(运行nvidia-smi)。在构建过程中,与GPU的可用性相关的任何检查都将无法进行。

使用CMD bin / bash并键入命令python3 -c 'import torch; print(torch.cuda.is_avaiable())',我终于得到了True。 我也删除了

RUN apt install nvidia-cuda-toolkit -y
RUN apt-get install nvidia-utils-410 -y

@RobertCrovella的建议