我在Ubuntu上运行Mesos并尝试执行:
mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--docker_image=nvidia/cuda \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"
因为:sh: 1: nvidia-smi: not found
即使我在没有容器支持的情况下运行它
mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"
它可以访问gpu
如果我在没有容器支持的情况下运行它,但将命令设为
nvidia-docker run -it nvidia/cuda nvidia-smi
它有效,所以看起来mesos容器不能访问GPU。但是在/etc/mesos-slave/
目录中我给了它containerizers mesos(以及所有其他必需的标志来运行gpu命令)。加上非gpu相关的命令工作正常。
答案 0 :(得分:1)
这看起来像1.3.0中的回归。我在Ubuntu上降级到1.2.1并且可以成功地将GPU与Docker容器和Mesos容器一起使用。
sudo apt-get install mesos=1.2.1-2.0.1
看起来有人提交了相关的错误但是没有活动: