为什么Google Colab在12小时前随机断开连接

时间:2018-10-05 17:46:02

标签: jupyter-notebook google-colaboratory

有时我的Colab笔记本电脑在12小时之前会断开连接,我很好奇为什么会这样。有时我会收到一条消息“运行系统已断开连接”。

在其他时间,没有消息。重新连接笔记本电脑后,好像有一段时间没用了(因为笔记本电脑没有说忙)。此外,我的tensorflow .meta和.data文件在最近8个小时左右的Google云端硬盘中有6个小时没有更新。

我在SO上发现了一些与我的问题类似的问题,但是其他人的情况似乎是初始化时它们被“卡住了”,但我的笔记本没有被“卡住”了。它带有复选标记。我什至尝试重新启动运行时,但是仍然没有迹象表明我的笔记本计算机以任何方式连接到了我的旧VM。

编辑:Google colab VM是否可以“抢占”?我知道Google计算引擎具有可以随时断开连接的“抢占式”计算机。由于付费客户使用可抢占式机器,因此对我来说,非付费客户使用的colab也可以抢占。我没有找到任何文档可以证明对colab的主张。

2 个答案:

答案 0 :(得分:5)

Google Colab不适用于长时间运行的任务。从Colab常见问题解答网页(重点是我的):

  

协作实验室旨在用于交互使用。长时间运行的后台计算(尤其是在GPU上)可能会停止。请不要使用Colaboratory进行加密货币挖掘。不支持这样做,可能会导致服务不可用。我们鼓励希望通过Colaboratory UI运行连续或长时间运行的计算的用户使用本地运行时。

以我的经验,“长时间运行的计算”包括训练神经网络以及运行超过两三个小时的bash命令。如上所述,这些类型的长时间运行的任务可能导致服务不可用,通常持续不超过几个小时。

答案 1 :(得分:-2)

只需重新连接,请等待几分钟以恢复最后的结果,它将从断开连接的位置恢复。