我有一个3节点的cassandra集群,复制因子为3,并且还在aws中的不同az上运行。
在我目前的设置中,我将所有3个节点配置为种子节点。(每个az 1个节点)。因此,当种子节点出现故障时,如何在不停机的情况下重新启动它?
我想不出一个合适的方法。因为第一步是从种子节点列表中删除种子节点,并对所有服务器进行滚动重新启动。当我这样做时,有一个持续时间只有一个节点在线,并且由于我的应用程序使用QUORUM进行查询,它失败了。
有没有办法通过只有3个副本来实现这一目的而没有停机时间?
提前致谢。
答案 0 :(得分:2)
种子节点用于群集拓扑的初始发现,然后通过八卦和发现来发现所有节点。继续交换信息直到下次重启。如果您的种子节点只是简单地关闭,那么只需启动它,它将连接其他种子节点&从中获取集群信息。
移除种子节点&只有在完全删除节点并将其替换为另一个节点时才需要滚动重启(如文档中所述)。