如何跨区域为 AWS EKS 实施灾难恢复?

时间:2021-06-29 06:43:02

标签: amazon-web-services microservices amazon-eks amazon-aurora disaster-recovery

我们需要跨区域(Us-East-1 和 Us-West-2)以主动-主动方式实施灾难恢复。我们所有的应用程序都被容器化并部署在 EKS 中。(很少有应用程序可以部署为 EC2 或 Lambda - 事件驱动)。 我们的高可用性要求是 99.999 微服务既是无状态又是有状态的(大多数微服务是无状态的)。我们正在使用 Amazon Aurora 数据库并启用了多可用区。 Us-East-1 中的主数据库和 Us-West-2 中的辅助数据库。 因此,您能否为我们的 AWS-EKS 以及场景建议 DR 方法。

1 个答案:

答案 0 :(得分:0)

只有两个快速建议:

  1. 对于 Aurora 数据库,我假设您使用的是 Aurora 全局数据库,这意味着主数据库可在 DR 区域中写入副本。这意味着在灾难期间,可以提升 DR 副本。 Aurora global db 最近宣布了托管故障转移,以进一步简化故障转移期间的操作:https://aws.amazon.com/about-aws/whats-new/2021/02/amazon-aurora-global-database-supports-managed-planned-failover/
  2. 对于 EKS 集群,了解您同时拥有无状态和有状态工作负载,如果您已经在使用 GitOps 工具(如 ArgoCD 或 FluxCD),他们可以轻松地将工作负载/配置部署到 DR 集群。对于有状态的工作负载,您将需要某种复制/备份/策略。为此,您可以考虑使用名为 Velero 的开源工具:https://velero.io/

在 AWS 之间有一篇关于操作多区域 EKS 集群的好帖子:https://aws.amazon.com/blogs/containers/operating-a-multi-regional-stateless-application-using-amazon-eks/

相关问题