使用GPU部署到GCE的Google Cloud DL容器找不到CUDA设备

时间:2019-11-14 23:37:52

标签: google-compute-engine nvidia-docker

我将Pytorch图像用于GPU:gcr.io/deeplearning-platform-release/pytorch-gpu.1-2:latest。我将其部署到具有K80和V100 GPU的GCE。

import torch
torch.cuda.device_count()
#returns 0

Cuda已安装。当我将SSH放入docker容器并在终端上运行以下命令时,可以看到它。

cat /usr/local/cuda/version.txt
CUDA Version 10.0.130

仅供参考,来自终端的nvidia-smi命令不起作用。我究竟做错了什么?还是docker镜像有问题?

1 个答案:

答案 0 :(得分:0)

似乎NVIDIA驱动程序未正确安装。请注意,“ each version of CUDA requires a minimum GPU driver version or a later version.”要检查您的CUDA版本所需的最低驱动程序,请参阅以下链接:Toolkit and Compatible Driver Versions

您可以遵循此link to install the driver manually。您还可以找到一些libraries that needs to be installed in this link