我们有一个奇怪的问题,我们不知道在哪里寻找答案。我们正在使用带有4个节点的Cassandra(2.0.10)集群。操作系统正在使用CentOS 6.4。我们通过转储他们的ps和顶级列表,每分钟使用rsh命令监视这些戴尔计算机。有一段时间(大约2周到超过一个月),我们发现其中一台机器的rsh命令返回非常缓慢(超过5秒,而不到1秒)。在那一刻,我们注意到putty对于那台特定的机器也很慢,而同一集群中的其他节点也没问题。在有问题的机器上,即使我们停止了cassandra服务,事情也没有改善。 SSH和ps命令仍然比其他机器慢得多。在我们重新启动机器之前,这没有得到改善。这发生在集群中使用的4台机器中的两台。我们查看了消息日志,硬件日志,cassandra日志,但无法找到此问题的根源。有没有人经历过这个?我们喜欢听到任何建议。