防止 GCP 维护人员重启 GKE 集群

时间:2021-02-21 04:50:36

标签: kubernetes google-cloud-platform google-kubernetes-engine

似乎每周 GKE 集群都会重新启动。我能做些什么来防止这种情况发生吗?它确实将 pod 迁移到其他节点,同时在其中一个节点上进行维护。但我不确定迁移过程中是否有停机时间,而且有时 Pod 会陷入崩溃 crashloopbackofferrimagepull 状态。

在维护期间如何进行迁移?当副本总数只有一个时,它是否会创建一个新的 Pod,然后路由流量,然后删除旧的 Pod?只是想知道是否有停机时间。它是一个新集群,还没有​​设置监控,所以不知道玩家是否在维护期间遇到停机。

有没有办法阻止 GCP 进行维护?我使用 terraform 创建集群,因此如果我可以阻止它,我需要通过 terraform 来完成,因为无法使用 GCP 控制台编辑 GKE 节点。

1 个答案:

答案 0 :(得分:1)

您可以configure your maintenance windows并启用/禁用自动节点升级。

以下是 GCP 控制台中配置选项的示例:

enter image description here

您还可以决定要成为哪个发布渠道(快速、定期和稳定)。

您的 Kubernetes control plane will have downtime if you have a zonal cluster。只有区域集群复制控制平面。

就您自己的应用而言,它们应该具有零停机时间,并且 GKE 会在 Pod 准备好接收流量时自动创建新节点并转移流量。