GKE似乎使用一个可用区域为主服务器创建一个集群,尽管它提供了将节点部署到多个可用区域的选项。我担心如果主控AZ发生故障,我就无法管理我的集群了。我了解我的应用程序将继续运行,但我无法扩展我的服务或部署新版本的应用程序,这是一个很大的问题。
我对" GKE集群的理解是否容易受到主区域故障的影响"正确?如果没有,你能解释一下吗?如果它是正确的,我有什么选择让它高度可用,以便它可以容忍一个可用区域下降?
答案 0 :(得分:2)
今天的GKE掌机不具备高可用性,如果区域出现故障,您的集群Kubernetes API将随之崩溃。但是,您应该注意GKE master是具有99.5%SLA的托管服务。 https://cloud.google.com/container-engine/sla将来,GKE可能会为主服务器(API服务器)提供高可用性解决方案。
您的理解是正确的,如果Kubernetes主/ API在短时间内不可用,则不会影响在群集上运行的已部署工作负载(例如网站或其他服务)。但你无法扩大/缩小事物。
作为用户,您无法做任何事情来使主人今天高度可用。
然而,我会说99.5%是一个非常好的正常运行时间。它相当于每天7分钟(https://uptime.is/99.5),如果您不是每周7天,每天24小时管理您的群集,您可能会偶尔看到问题。如果您使用自动化,则应该有一些重试逻辑。
答案 1 :(得分:2)
GKE regional clusters提供了多主机设置,该区域的每个区域中都有一个主机。请参阅launch blog post以获得快速概述。