GCP(AI平台笔记本)上的“服务器连接错误”

时间:2020-02-26 21:46:50

标签: google-cloud-platform google-cloud-ml jupyter-lab gcp-ai-platform-notebook google-dl-platform

我遇到了GCP和AI平台(Jupyterlab)的一些问题 似乎我无法长时间与服务器保持稳定的连接。我不断收到“ 服务器连接错误”消息。从那里有两种可能性:

  • 什么也没发生,我的手机一直在运转 或
  • 单元已停止运行,我可以在笔记本右上角看到状态“ 无内核!”。每当我再次选择一个内核(python 3)时,根据运气我可以继续工作,或者该单元格将显示运行状态(其左侧带有*),但左下方的内核状态将保持不变。 :“已连接”(而不是“忙碌”)。对于后者,我需要重新启动内核并再次运行所有单元,这可能会很长。

有时候,这发生在我(重新)启动实例之后运行第一个单元时,有时会稍后。我能够在笔记本上正常工作的最长稳定时间是20、30 ish分钟,这很烦人。

我的主要实例的配置: -16个CPU -60GB RAM -P100 NVIDIA GPU

我尝试了不同类型的实例,但仍然遇到相同的问题,家里的网络很稳定。

error message

2 个答案:

答案 0 :(得分:1)

您在工作中使用什么操作系统和浏览器? 我遇到了与使用Firefox浏览器的Ubuntu 18相同的问题。 当我使用Chrome切换到Windows时,即使是同一网络,也不会再次出现该错误。

答案 1 :(得分:1)

我今天有一个类似的问题:根据google docs的原因是docker / Jupyter服务没有启动。

在我们的特定情况下无法启动这些服务的原因是磁盘已满。