无法使用GPU任务运行Mesos Containers

时间:2017-07-20 23:13:40

标签: gpu mesos

我在Ubuntu上运行Mesos并尝试执行:

mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--docker_image=nvidia/cuda \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"

因为:sh: 1: nvidia-smi: not found

而失败

即使我在没有容器支持的情况下运行它

mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"

它可以访问gpu

如果我在没有容器支持的情况下运行它,但将命令设为

nvidia-docker run -it nvidia/cuda nvidia-smi

它有效,所以看起来mesos容器不能访问GPU。但是在/etc/mesos-slave/目录中我给了它containerizers mesos(以及所有其他必需的标志来运行gpu命令)。加上非gpu相关的命令工作正常。

1 个答案:

答案 0 :(得分:1)

这看起来像1.3.0中的回归。我在Ubuntu上降级到1.2.1并且可以成功地将GPU与Docker容器和Mesos容器一起使用。

sudo apt-get install mesos=1.2.1-2.0.1

看起来有人提交了相关的错误但是没有活动:

https://issues.apache.org/jira/browse/MESOS-7730