How do I receive notification if a Google Compute Engine instance restarts or migrates on maintenance?

时间:2017-06-20 12:35:35

标签: google-cloud-platform google-compute-engine

I would love to receive an email (or other form of notification) every time my Compute Engine VM restarts, so I can connect and see that everything has started up again properly (and generate a general feel for the reliability of my instance)

I've looked through all the options in the Google Cloud Console, but haven't found anything...

2 个答案:

答案 0 :(得分:3)

如果您还没有,请浏览Live Migration文档,了解实时迁移的工作原理。

Live migrate

Google提供了设置instance availability policies的控件,它还可以让您控制实时迁移的各个方面。在这里,他们还提到要确定何时进行实时迁移的内容。

  

默认情况下,标准实例设置为实时迁移,即Google   Compute Engine会自动将您的实例迁移出来   基础架构维护事件,您的实例仍在运行   在迁移过程中。您的实例可能会经历短暂的一段时间   性能下降,但通常大多数情况下不应该   注意任何差异。这非常适合需要的实例   持续正常运行时间,可以忍受短时间的减少   性能

     

当Google Compute Engine迁移您的实例时,会报告系统   发布到区域操作列表的事件。你可以复习   此活动通过执行 gcloud compute operations list --zones ZONE   请求或查看Google Cloud中的操作列表   平台控制台,或通过API请求。该事件将出现   使用以下文字:

compute.instances.migrateOnHostMaintenance

Getting Live Migration Notices

此外,您可以在维护事件即将发生时直接在VM上进行检测。

  

元数据服务器提供有关实例的信息   scheduling options and settings,通过安排/   目录和维护事件属性。你可以使用这些   用于了解虚拟机实例的调度的属性   选项,并使用此元数据在维护事件时通知您   即将通过maintenance-event属性发生。通过   默认情况下,所有虚拟机实例都设置为实时迁移所以   元数据服务器将在VM之前收到维护事件通知   实例是实时迁移的。如果您选择拥有VM实例   在维护期间终止,然后计算引擎将自动终止   如果是,则终止并可选地重新启动VM实例   automaticRestart属性已设置。要了解有关维护的更多信息   事件期间的事件和实例行为,请阅读scheduling options and settings

     

您可以通过查询来了解维护事件何时发生   maintenance-event定期定义属性。这个的价值   属性将在维护事件开始前60秒更改,   为您的应用程序代码提供一种触发您想要的任何任务的方法   在维护事件之前执行,例如备份数据或   更新日志。计算引擎还提供sample Python script   演示如何检查维护事件通知。

     

您可以在等待时使用maintenance-event属性   更新功能,以便在a时通知您的脚本和应用程序   维护事件即将开始和结束。这可以让你自动化   您可能希望在事件之前或之后运行的任何操作。该   以下Python示例提供了一个如何实现的示例   这两个特征在一起。

Terminate and (optionally) restart

如果要禁用实时迁移,可以选择在发生维护事件时终止并可选地重新启动实例。

  

如果您不希望实例迁移,可以选择   终止并可选择重启您的实例。有了这个选项,   Google Compute Engine会发出关闭您的实例的信号,等待   您的实例可以在短时间内完全关闭,   终止实例,并从维护中重新启动它   事件。此选项非常适合需要不变的实例,   最高性能,您的整体应用程序可以处理   实例失败或重启。

请查看Setting availability policies部分,了解有关如何配置此内容的更多详细信息。

Live migration and GPUs

如果您使用具有GPU或可抢占实例的实例,请注意不支持实时迁移:

  

附加了GPU的实例无法进行实时迁移。必须设置它们   终止并可选择重启。计算引擎提供60分钟   连接GPU的VM实例终止前的通知。至   了解有关这些维护事件通知的更多信息,请阅读“获取”   移民通知。

     

要了解有关使用GPU处理主机维护的更多信息,请阅读   关于GPU文档的Handling host maintenance

     

Live migration for preemptible instances

     

您无法将preemptible instances配置为实时迁移。该   可抢占实例的维护行为始终设置为   默认情况下为TERMINATE,您无法更改此选项。也是   无法为preemptible设置automatic restart选项   实例

     

注意:对于使用GPU的实例,属性会在实例终止前60分钟更改,以便您有时间关闭   在另一台主机上重新启动。 GPU的实例不是实时的   已迁移,而是终止并可选择重新启动。学习   更多,阅读处理GPU文档中的主机维护。

答案 1 :(得分:0)

Stackdriver为事件驱动的通知提供了很多选项。请参阅Serverfault上的答案: