我们有一个大型的Cassandra集群18台服务器(在一台服务器上靠近5T数据)
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html - 我们在此文档后添加了新节点。
添加新服务器后,我们开始清理数据(nodetool cleanup)
在文档建议中:在所有新节点运行后,在每个先前存在的节点上运行nodetool cleanup以删除不再属于这些节点的密钥。等待清理在一个节点上完成,然后再进行下一步
但在我们的案例中,一台服务器的清理工作需要2到3天。 我的问题是我可以在多台服务器上立即开始清理,2或3 ......
或者它可能导致数据丢失?
更多信息。
我们将cassandra 2.0.13与vnodes一起使用。我们还在cassandra保存文件。
复制因子= 3
答案 0 :(得分:5)
清理不涉及任何其他节点,因此并行运行是安全的。但是,您可能希望一次运行一个以减少性能影响,因为清理可能会使用大量磁盘I / O.