有没有人找到一种方法来获得对GPU运行时的稳定访问?
目前我遵循这个过程:
./install.sh
检查GPU是否已启用:
Runtime -> Change runtime type -> "Python 2" and "GPU" -> Save -> Runtime -> Connec to runtime...
然而,我得到了import tensorflow as tf
tf.test.gpu_device_name()
,虽然我在30岁时能够连接1次。有没有人有任何想法发生了什么?
答案 0 :(得分:0)
权威地知道您连接的运行时类型的方法是将鼠标悬停在右上角的CONNECTED按钮上;如果悬停工具提示后缀为“(GPU)”,那么你就有了GPU。
您可以通过检查执行!/opt/bin/nvidia-smi
的输出来测试GPU硬件的运行状况(顺便说一下,它只能在GPU运行时上找到)。
Tensorflow无法在nvidia-smi
可以看到GPU时通常会出现类似以下情况的症状:
!pip install -U tensorflow
这会让你获得一个不知道如何与GPU对话的TF版本。所有的实验室运行时都已经预安装了TF,因此您不需要重新安装它。如果您需要TF预装版本中没有的特定功能,您可以获得一个知道如何通过!pip install -U tensorflow-gpu
与GPU通信的构建,但请注意预先安装的TF构建更优化对于所使用的特定CPU平台,您将放弃一些性能,以及使用更多RAM。
如果由于!pip install -U
使用依赖于tensorflow的其他内容而只重新安装了TF版本,则可以通过指定应保留预安装TF的--upgrade-strategy=only-if-needed
来避免这种情况到位。
如果你搞砸了你的运行时并且想要清除平板,请执行
kill -9 -1
并等待15-30秒重新连接。