我的问题是我无法使用我的GPU,因为torch.cuda.device_count()返回0,而torch.cuda.is_available()为False。
我发现torch._C._cuda_getDriverVersion()返回10000,nvcc --version是
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
torr.version.cuda是10.2。
此外,即使我使用以下命令安装了cuda工具包和实用程序,nvidia-smi
也无法在容器内运行:
RUN apt install nvidia-cuda-toolkit -y
RUN apt-get install nvidia-utils-410 -y
nvidia-smi
错误是:无法初始化NVML:未知错误
我的基本图像是nvidia / cuda:10.0-cudnn7-devel。
编辑:
我尝试了docker run --gpus all nvidia/cuda:10.0-cudnn7-devel nvidia-smi
,它可以正常工作,并且显示与本地计算机相同的nvidia-smi