在阅读关于AZ的云代工厂文档时,它提到:
只要大多数AZ仍可访问,Cloud Foundry就会保持其可用性。例如,当整个AZ出现故障时,三个AZ部署会保持不变,而五个AZ部署可以承受最多两个AZ的中断而不会影响正常运行时间
我不明白为什么?我的理解是当一个AZ仍然可访问时,三个AZ部署仍然存在,与五个AZ部署相同,我应该如何理解这一点?
答案 0 :(得分:0)
假设AZ 1失去与AZ 2和AZ 3的连接.AZ 1假设AZ 2和AZ 3发生故障,并开始启动AZ 2和3的工作负载以恢复容量。与此同时,AZ 2和AZ 3认为AZ 1已经失败,并且它开始启动冗余工作负载,因为它认为群集是唯一的幸存者。您现在有两个运行竞争工作负载的恶意集群。
防止该方案并确保您的工作负载仅在一个群集中运行的唯一方法是要求将大多数连接的AZ指定为唯一的幸存者。