使用nvidia-docker-compose启动一个容器,但很快就会退出

时间:2016-12-27 13:49:05

标签: docker-compose

我的docker-compose.yml文件:

version: '2'
services:
  zl:
    image: zl/caffe-torch-gpu:12.27
    ports:
      - "8801:8888"
      - "6001:6008"
    devices:
      - /dev/nvidia0
    volumes:
      - ~/dl-data:/root/dl-data

nvidia-docker-compose up -d容器启动后,但很快就退出了。

但是,当我按nvidia-docker方式启动容器时,效果很好。

nvidia-docker run -itd -p 6008:6006 -p 8808:8888 -v `pwd`:/root/dl-data --name zl_test 

1 个答案:

答案 0 :(得分:3)

您不必使用nvidia-docker-compose。 通过正确配置nvdia-docker插件,您只需使用docker-compose!

通过nvidia docker git repo: (可以确认它对我有用)

第1步:

找出nvidia驱动程序版本(重要)。 跑:

 nvidia-smi

输出:

+ ---------------------------------------------- ----------------- +

NVIDIA-SMI 367.57驱动程序版本:367.57

| ------------------------------- + -------- + - - - - ----------------- +

第2步:

创建一个使用nvidia-docker插件的docker卷必须在compose之外完成,因为compose会在创建它时破坏卷名。

docker volume create --name=nvidia_driver_367.57 -d nvidia-docker

第3步

在docker-compose.yml文件中:

version: '2'
    volumes:
      nvidia_driver_367.57: # same name as one created above
        external: true  #this will use the volume we created above

    services:
      cuda:
        command: nvidia-smi
        devices:  #this is required
        - /dev/nvidiactl
        - /dev/nvidia-uvm
        - /dev/nvidia0 #in general: /dev/nvidia# where # depends on which gpu card is wanted to be used
        image: nvidia/cuda
        volumes:
        - nvidia_driver_367.57:/usr/local/nvidia/:ro