我有Cassandra 3.11.1.0集群(6个节点),并且在加入2个节点后没有进行清理。
我在第一个节点(192.168.20.197)上启动了nodetool cleanup
,清理工作将近30天。
$ nodetool status
Datacenter: dc1
===============
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UN 192.168.20.109 33.47 GiB 256 ? 677dc8b6-eb00-4414-8d15-9f1c79171069 rack1
UN 192.168.20.47 35.41 GiB 256 ? df8c1ee0-fabd-404e-8c55-42531b89d462 rack1
UN 192.168.20.98 20.65 GiB 256 ? 70ce02d7-779b-4b5a-830f-add6ed64bcc2 rack1
UN 192.168.20.21 33.03 GiB 256 ? 40863a80-5f25-464f-aa52-660149bc0070 rack1
UN 192.168.20.197 25.98 GiB 256 ? 5420eae3-e643-49e2-b2d8-703bd5a1f2d4 rack1
UN 192.168.20.151 21.9 GiB 256 ? be7d5df1-3edd-4bc3-8f34-867cb3b8bfca rack1
所有未清理的节点现在都处于负载下(CPU负载〜80-90%),但是新加入的节点(节点192.168.20.98和192.168.20.151)的CPU负载约为10-20%
由于可以清除的旧数据,看来已加载了旧节点。
每个节点具有61GB RAM和8个CPU内核。 HEAP大小为30Gb
所以,我的问题是