我有一个GCE VM实例,该实例在过去3个月中两次脱机约一个小时。在这两种情况下,它都会自行恢复。我想知道如何找出问题,以免再次发生。
在此一小时内,无法通过SSH访问实例,并且网站已关闭。
我在网上查找:
我知道我的问题很模糊,但是我需要帮助才能开始查找错误的来源。本质上,我不知道我在寻找什么以及应该去哪里。非常感谢您的帮助。
答案 0 :(得分:1)
您的VM是否使用本地SSD?
来自https://cloud.google.com/compute/docs/disks/local-ssd#data_persistence:
“如果主机系统遇到主机错误,Compute Engine会尝试保留本地SSD数据,但只有在底层驱动器在60分钟内恢复后,它才能这样做。”
尝试恢复数据可以解释您的停机时间。
答案 1 :(得分:0)
时间是否与https://status.cloud.google.com/summary上列出的任何Google Compute Engine或Google Cloud Networking事件相符?如果是这样,则可能是您受故障影响了。