1)我们有10个节点的集群,最近我们又向集群添加了20个节点。
2)添加后,我们在所有必要的节点上运行清理。
3)在响铃状态下,“有效所有权”被正确平衡,但两台机器上的“负载”与其他机器不同。
rack1 Up Normal 196.38 GB 6.67%
rack2 Up Normal 195.33 GB 6.67%
rack1 Up Normal 191.57 GB 6.67%
rack2 Up Normal 197.83 GB 6.67%
rack1 Up Normal 190.92 GB 6.67%
rack2 Up Normal 194.59 GB 6.67%
rack1 Up Normal 195.66 GB 6.67%
rack2 Up Normal 191.45 GB 6.67%
rack1 Up Normal 197.13 GB 6.67%
rack2 Up Normal 196.19 GB 6.67%
rack1 Up Normal 195.39 GB 6.67%
rack2 Up Normal 199.35 GB 6.67%
rack1 Up Normal 197.71 GB 6.67%
rack2 Up Normal 194.22 GB 6.67%
rack1 Up Normal 192.83 GB 6.67%
rack2 Up Normal 197.17 GB 6.67%
rack1 Up Normal 192.61 GB 6.67%
rack2 Up Normal 193.88 GB 6.67%
rack1 Up Normal 197.3 GB 6.67%
rack2 Up Normal 196.74 GB 6.67%
rack1 Up Normal 194.89 GB 6.67%
rack2 Up Normal 198.47 GB 6.67%
rack1 Up Normal 197.26 GB 6.67%
rack2 Up Normal 345.34 GB 6.67%
rack1 Up Normal 195.68 GB 6.67%
rack2 Up Normal 263.23 GB 6.67%
rack1 Up Normal 190.72 GB 6.67%
rack2 Up Normal 198.98 GB 6.67%
rack1 Up Normal 194.22 GB 6.67%
rack2 Up Normal 191.95 GB 6.67%
4)一台机器的负载为345GB,另一台机器的负载为263GB,而机器的其余部分则为195GB左右。
5)我们正在使用Cassandra-1.1.0并且我已经在这些机器上运行了两次清理,但它没有帮助。
任何想法如何在每个节点上以相同的负载平衡此群集?
答案 0 :(得分:2)
我遇到了服务器负载高于其他服务器的问题。
在我的情况下发生的事情是,由于某种原因引导失败,中断了数据流。当您恢复时,数据流从头开始,但之前的数据不会被删除,并显示在nodetool status
的输出中。
对我而言,最简单的方法就是按照此过程替换死节点的那些节点:http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_replace_node_t.html
编辑:nodetool cleanup
只删除不属于该节点的密钥,这并不意味着它可以释放磁盘空间。