无法连接到GPU运行时

时间:2018-02-07 21:05:11

标签: python tensorflow google-colaboratory

有没有人找到一种方法来获得对GPU运行时的稳定访问?

目前我遵循这个过程:

./install.sh

检查GPU是否已启用:

Runtime -> Change runtime type -> "Python 2" and "GPU" -> Save -> Runtime -> Connec to runtime... 

然而,我得到了import tensorflow as tf tf.test.gpu_device_name() ,虽然我在30岁时能够连接1次。有没有人有任何想法发生了什么?

1 个答案:

答案 0 :(得分:0)

权威地知道您连接的运行时类型的方法是将鼠标悬停在右上角的CONNECTED按钮上;如果悬停工具提示后缀为“(GPU)”,那么你就有了GPU。

您可以通过检查执行!/opt/bin/nvidia-smi的输出来测试GPU硬件的运行状况(顺便说一下,它只能在GPU运行时上找到)。

Tensorflow无法在nvidia-smi可以看到GPU时通常会出现类似以下情况的症状: !pip install -U tensorflow 这会让你获得一个不知道如何与GPU对话的TF版本。所有的实验室运行时都已经预安装了TF,因此您不需要重新安装它。如果您需要TF预装版本中没有的特定功能,您可以获得一个知道如何通过!pip install -U tensorflow-gpu与GPU通信的构建,但请注意预先安装的TF构建更优化对于所使用的特定CPU平台,您将放弃一些性能,以及使用更多RAM。

如果由于!pip install -U使用依赖于tensorflow的其他内容而只重新安装了TF版本,则可以通过指定应保留预安装TF的--upgrade-strategy=only-if-needed来避免这种情况到位。

如果你搞砸了你的运行时并且想要清除平板,请执行 kill -9 -1并等待15-30秒重新连接。