应用错误收集

我们正在运行一个Cassandra 5节点集群（3.10），该集群具有8个核心，32个内存和2TB磁盘。该集群在Google Cloud上的k8s中运行。

最近，我们在每个节点上将磁盘大小从400GB增加到〜800GB，这时我们开始因许多读/写超时而停止工作。在检查节点在其资源中的使用情况时，我们注意到其CPU为1.5-2，内存为17GB。

似乎它们是出于某种原因而束缚的，我们看到的唯一观察结果是磁盘大小与使用的cpu之间存在反相关关系，磁盘使用率越高，cpu使用率越低。

有没有办法查看是什么阻碍了CPU和RAM使用100％的资源？