我正在尝试安装NVIDIA docker。 我用了以下几行:
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
然后:
$ sudo apt-get install nvidia-docker
现在尝试通过键入以下内容检查其是否正确安装:
nvidia-docker run --rm nvidia/cuda nvidia-smi
出现此错误:
nvidia-docker | 2018/11/06 13:09:24错误:在获得权限时被拒绝 尝试在以下位置连接到Docker守护程序套接字 unix:///var/run/docker.sock:获取 http://%2Fvar%2Frun%2Fdocker.sock/v1.38/version:拨打Unix /var/run/docker.sock:连接:权限被拒绝
后来我尝试:
sudo nvidia-docker run --rm nvidia/cuda nvidia-smi
出现此错误:
使用默认标签:最新最新:从nvidia / cuda中提取 473ede7ed136:拉出完成c46b5fa4d940:拉出完成 93ae3df89c92:拉动完成6b1eed27cade:拉动完成 d31e9163d0a5:拉动完成8668af631f88:拉动完成 0d99f8ab6ae2:提取完整74440c29d798:提取完整摘要: sha256:a6b5fd418d1cd0bc6d8a60c1c4ba33670508487039b828904f8494ec29e6b450 状态:为nvidia / cuda下载的更新映像:最新的docker:错误 来自守护程序的响应:OCI运行时创建失败: container_linux.go:348:启动容器进程引起“执行: \“ nvidia-smi \”:在$ PATH中找不到可执行文件“:未知。
我在Ubuntu上安装Linux。 有人可以帮我吗?
答案 0 :(得分:1)
您有两个很明显的错误。
首先,似乎您的登录用户不允许连接到docker守护程序。 这是一个非常标准的问题,您只需将用户登录名添加到docker组,即可解决此问题。您需要再次注销/登录才能使此更改生效。
第二,这也是一个标准的Linux问题,您的外壳程序具有一个名为PATH的环境变量,其中包含所有将在其中查找二进制命令的文件夹,而该命令不包含二进制文件的完整路径。
例如,当您键入curl以下载docker-nvidia时,您的外壳程序会在/usr/bin/
文件夹中找到它,因为此文件夹已在PATH变量中声明。
对于您下载的容器和本地系统上的其他用户,同样适用。您可以调查此特定的错误消息,并在github上找到此问题:https://github.com/NVIDIA/nvidia-docker/issues/388
答案 1 :(得分:0)
首先为软件包设置GPG和远程仓库
$ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list
然后更新apt列表
$ sudo apt-get update
现在您安装nvidia-docker(2)并重新加载Docker守护程序配置
$ sudo apt-get install -y nvidia-docker2
$ sudo pkill -SIGHUP dockerd
Nvidia GPU首先需要安装驱动程序。这是确保它们已安装的方式
$ sudo apt-get remove nvidia -384 ; sudo apt-get install nvidia-384
现在,剩下要做的就是测试您的环境并确保正确安装了所有内容。只需启动nvidia-smi(系统管理界面)应用程序即可。
$ docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi
输出将类似于以下内容:
+ ---------------------------------------------- ------------------------------- +
| NVIDIA-SMI 390.77驱动程序版本:390.77 | | ------------------------------- + ----------------- ----- + ---------------------- +
| GPU名称持久性-M |总线编号Disp.A |挥发性不佳。 ECC | |风扇温度性能:用法/上限|内存使用| GPU实用计算M。|
| =============================== + ============== ======== + ==================== |
| 0特斯拉K80关闭| 00000000:00:1E.0关闭| 0 | |不适用39C P0 83W / 149W | 0MiB / 11441MiB | 98%
默认| + ------------------------------- + ----------------- ----- + ---------------------- +
参考:https://cnvrg.io/how-to-setup-docker-and-nvidia-docker-2-0-on-ubuntu-18-04/