应用错误收集

我们有一个奇怪的问题，我们不知道在哪里寻找答案。我们正在使用带有4个节点的Cassandra（2.0.10）集群。操作系统正在使用CentOS 6.4。我们通过转储他们的ps和顶级列表，每分钟使用rsh命令监视这些戴尔计算机。有一段时间（大约2周到超过一个月），我们发现其中一台机器的rsh命令返回非常缓慢（超过5秒，而不到1秒）。在那一刻，我们注意到putty对于那台特定的机器也很慢，而同一集群中的其他节点也没问题。在有问题的机器上，即使我们停止了cassandra服务，事情也没有改善。 SSH和ps命令仍然比其他机器慢得多。在我们重新启动机器之前，这没有得到改善。这发生在集群中使用的4台机器中的两台。我们查看了消息日志，硬件日志，cassandra日志，但无法找到此问题的根源。有没有人经历过这个？我们喜欢听到任何建议。

SSH缓慢的Cassandra集群

0 个答案: