我在客户处安装了6节点VM Apache Cassnadra 1.0.6环。我们在云提供商中使用HA Proxy。我们最初提供了完整的设置,然后IT客户进入那里以使其更好。现在我们继续遇到我们被指责的问题,我们必须确定原因。
我在一个特定节点上看到,我们继续有一个高提示的切换队列。我还看到一个数据非常少的节点。
我怀疑节点没有在环上进行通信。是否有一个命令或一些其他工具或方法可以用来查看八卦消息是否应该响应它?
更一般地说,确定Cassandra环网络的健康/配置的最佳方法/工具是什么。我想确保所有节点都能通过八卦相互通信,并且正在复制数据。
答案 0 :(得分:2)
众所周知,Gossip协议负责点对点通信,所以基本上如果我们跟踪rpc端口即9160(默认),那么我们可以得到一些相关信息
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47166 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47164 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp 0 0 XXX.XX.XX.XX:47162 XXX.XX.XX.XX:9160 ESTABLISHED 1334/python2.7 off (0.00/0/0)
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47163 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp 0 0 XXX.XX.XX.XX:47164 XXX.XX.XX.XX:9160 ESTABLISHED 1334/python2.7 off (0.00/0/0)
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47167 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47165 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp 0 0 XXX.XX.XX.XX:47166 XXX.XX.XX.XX:9160 ESTABLISHED 1334/python2.7 off (0.00/0/0)
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47162 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp 0 0 XXX.XX.XX.XX:9160 XXX.XX.XX.XX:47168 ESTABLISHED 21990/java keepalive (5554.50/0/0)
tcp6 0 0 XXX.XX.XX.XX:47167 XXX.XX.XX.XX:9160 ESTABLISHED 2215/java keepalive (5554.50/0/0)
tcp6 0 0 XXX.XX.XX.XX:47168 XXX.XX.XX.XX:9160 ESTABLISHED 1189/java off (0.00/0/0)
根据这些信息,我们可以很容易地确定,是的,Gossip仍在工作。