我对Couchbase(3.1)的RAZ + Replica + autoFailover行为有疑问。
我想模拟以下配置和灾难情景:
VMWare VCenter提供的vm平台上有2个节点(模拟couchbase群集的第一部分成员来自主要生产区域)。和 RHEV(基于KVM)提供的vm平台上有3个节点(模拟couchbase群集的第二部分成员来自同一数据中心的辅助产品区域)
所有这5个节点都安装了相同的操作系统和相同版本的couchbase(3.1)位。 并配置为一个集群,其中一个存储桶已创建,第一轮测试时复制副本= 2,此后该存储桶更改为3。 "自动故障转移"设置已启用。
假设二级生产区域(由RHEV平台提供)中的三个节点同时崩溃(模拟二级区域完全失败,例如整个RHEV平台因停电而崩溃)。
最小化群集可用性受损的最佳方法是什么,并减少连接/操作couchbase群集的应用程序的影响。(r / w操作)。
对于这3个节点崩溃的场景,充分利用机架感知,微调副本数量和正确操作步骤的最佳组合是什么?
btw:假设在执行故障转移(或autoFailover)时没有容量/负载问题,也就是级联故障。
由于
答案 0 :(得分:1)
如果您要将RZA与您谈论的两个管理程序一起使用,我会以均匀的数量执行此操作。每个HV上有3个节点,HV#1上的所有节点都在服务器组#1中,HV#2上的所有节点都在服务器组#2中。你只需要1个副本。对于故障情况,你提到当整个HV发生故障时,拥有多个副本根本无法帮助你。当像我提到的那样运行RZA时,SG#1中节点的所有副本都在SG#2的节点上结束,反之亦然。希望这是有道理的。
此外,我们所讨论的配置中的RZA是生产中仅限企业版的功能,因此这意味着您已经为此付费(生产中超过2个节点的任何内容都必须获得许可)。我只提到这一点,因为这些事情可以提供给您的Couchbase客户经理或技术支持团队,以获得此更详细的帮助。