如何应对无响应的数据实验室进行故障排除?

时间:2018-09-24 20:51:53

标签: google-cloud-datalab

我的笔记本电脑在使用托管在Google Cloud Compute Engine上的datalab VM时经常无响应。我在Chrome中拥有的所有打开的标签页(项目文件目录,几个笔记本和Ungit)都不会重新加载。如果让它等待几分钟,这些选项卡将恢复,但是不久之后它们将恢复无响应。当前,我唯一的解决方法是重置VM,这似乎可以解决问题一小会儿(不到一个小时)。我已经检查了VM监控,但看不到任何资源耗尽,CPU从未超过50%。日志不包含任何警告或错误。我应该如何继续对无响应的数据实验室进行故障排除?

2 个答案:

答案 0 :(得分:1)

我建议使用update the Datalab instance,因此您必须在保留磁盘的同时删除实例。完成后,您可以使用同一磁盘创建它:

datalab delete --keep-disk instance-name
datalab create instance-name

通过此操作,您将创建具有最新更新的实例,该更新已解决了问题。

答案 1 :(得分:0)

关于如何诊断它,您可以尝试以下操作:

  1. 在代码单元内运行!ps auxfww。这将告诉您哪些进程正在运行,并且您可以查看是否有某些不应运行的进程。
  2. 在代码单元内部运行!top -b -n 1,以查看哪些进程正在使用哪些资源。这样可以告诉您是否存在使用大量RAM或CPU的东西。
  3. 在代码单元内部运行!df -h,以查看可用的磁盘空间。如果其中一个磁盘分区已满,则可能会导致问题。