我是使用训练神经网络的新手。我可以访问GPU集群,我正在微调Alex-Net版本以进行场景分类。
我现在可以访问两个GPU,我想同时使用它们进行培训。 nvidia-smi命令给出了GPU的ID(0和1)。
这就是我使用两种GPU的培训方式:
caffe.set_mode_gpu()
caffe.set_device([0,1])
这是正确的使用方法吗?
答案 0 :(得分:1)
Python允许您使用set_device()
选择单个GPU。只有C ++接口支持多GPU。我们讨论了用于此目的的--gpu
标志here。可以使用--gpu
工具的命令行上的Caffe
标志设置要用于训练的GPU。例如,
build/tools/caffe train --solver=models/bvlc_alexnet/solver.prototxt --gpu=0,1
将训练GPU 0和1。
答案 1 :(得分:1)
在终端中你可以这样输入:
python yourpythonfile.py CUDA_VISIBLE_DEVICES=0, 1