我们正在运行一个Cassandra 5节点集群(3.10),该集群具有8个核心,32个内存和2TB磁盘。 该集群在Google Cloud上的k8s中运行。
最近,我们在每个节点上将磁盘大小从400GB增加到〜800GB,这时我们开始因许多读/写超时而停止工作。 在检查节点在其资源中的使用情况时,我们注意到其CPU为1.5-2,内存为17GB。
似乎它们是出于某种原因而束缚的,我们看到的唯一观察结果是磁盘大小与使用的cpu之间存在反相关关系,磁盘使用率越高,cpu使用率越低。
有没有办法查看是什么阻碍了CPU和RAM使用100%的资源?