GCE实例停止工作1小时

时间:2018-08-15 15:10:01

标签: google-compute-engine

我有一个GCE VM实例,该实例在过去3个月中两次脱机约一个小时。在这两种情况下,它都会自行恢复。我想知道如何找出问题,以免再次发生。

  • 在此一小时内,无法通过SSH访问实例,并且网站已关闭。

  • 我在网上查找:

    1. 有人建议磁盘空间可能已满,但对我而言并非如此。
    2. 有人建议查看实例日志,没有什么不寻常的地方。
  • 我知道我的问题很模糊,但是我需要帮助才能开始查找错误的来源。本质上,我不知道我在寻找什么以及应该去哪里。非常感谢您的帮助。

2 个答案:

答案 0 :(得分:1)

您的VM是否使用本地SSD?

来自https://cloud.google.com/compute/docs/disks/local-ssd#data_persistence

“如果主机系统遇到主机错误,Compute Engine会尝试保留本地SSD数据,但只有在底层驱动器在60分钟内恢复后,它才能这样做。”

尝试恢复数据可以解释您的停机时间。

答案 1 :(得分:0)

时间是否与https://status.cloud.google.com/summary上列出的任何Google Compute Engine或Google Cloud Networking事件相符?如果是这样,则可能是您受故障影响了。