nvidia-container-cli:初始化错误:cuda错误:未检测到具有cuda功能的设备

时间:2017-11-29 11:46:30

标签: docker nvidia-docker

我正在使用nvidia / cuda:8.0-devel图像并尝试运行它。但是我收到以下错误。

sudaraka@RnDCompute:~$ docker run -it --runtime=nvidia nvidia/cuda:8.0-devel docker: Error response from daemon: oci runtime error: container_linux.go:265: starting container process caused "process_linux.go:368: container init caused \"process_linux.go:351: running prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --compute --utility --require=cuda>=8.0 --pid=12053 /var/lib/docker/overlay2/a72cba41e94578ff91c71ab56b07d8e9153386e43383482ac649419ae0a77220/merged]\\\\nnvidia-container-cli: initialization error: cuda error: no cuda-capable device is detected\\\\n\\\"\"".

它表示没有检测到具有cuda功能的设备。 我安装了cuda 8.0。

sudaraka@RnDCompute:~$ nvcc --version nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2016 NVIDIA Corporation Built on Mon_Jan_23_12:24:11_CST_2017 Cuda compilation tools, release 8.0, V8.0.62

和司机一样。

sudaraka@RnDCompute:~$ cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 384.98 Thu Oct 26 15:16:01 PDT 2017 GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.4)

我的码头版本是17.09.0-ce。由于没有检测到具有cuda功能的设备,我得到的错误可能是什么问题?

谢谢

1 个答案:

答案 0 :(得分:0)

安装可能没有成功完成,您能否显示nvidia-smi的结果? ,则应尝试以单独的模式安装cuda和nvidia-driver,例如:

cuda 9.2和nvidia驱动程序396

CUDA

这里有几个问题,请不要在以下内容中提出:

  • 安装NVIDIA加速图形驱动程序(N)
  • 是否要安装OpenGL库? (N)
  • 是否要运行nvidia-xconfig? (N)

NVIDIA

  • sudo add-apt-repository ppa:graphics-drivers / ppa
  • sudo apt更新
  • sudo apt安装nvidia-396

安装 cuda 后,它将位于/ usr / local / cuda中,并使用 nvidia-smi

测试nvidia驱动程序

安装, docker nvidia-docker ,并测试:

  • docker run -it --runtime = nvidia nvidia / cuda:8.0-devel

  • nvidia-docker run -it --runtime = nvidia nvidia / cuda:8.0-devel

我希望它有用,让我知道!