对于GCE的Compute Engine,我使用堆栈驱动程序监视进行监视和警报。 对于大多数常规指标,例如CPU,磁盘IO,内存等,都可用,并且可以按进程名称为这些指标设置警报或死活。
但是我找不到任何与GCE实例本身状态有关的指标。
我的用例非常简单。我想知道实例ID是否关闭。 任何建议表示赞赏。 谢谢。
答案 0 :(得分:3)
认为实例状态不是monitoring metric;只有instance/uptime
可用。
(而且我不知道当它为terminated
时会返回什么,可能值得一试)。
但是可以用Uptime Checks检查服务器,然后报告Incident。
使用gcloud compute instances describe instance01
可以得到instance status。