间歇性的cassandra节点停机几秒钟

时间:2016-08-16 17:50:27

标签: cassandra

我看到这种行为非常多,在八卦阶段,一个节点无法被发现并提示警告" INET IPADDR现在已经关闭",但几秒后它就会出现。当我检查节点时,它实际上没有关闭,但是不能通过其他节点发现。由于这个问题,提示非常高。

可能导致此错误的原因是什么,以及如何减轻这些错误?

1 个答案:

答案 0 :(得分:0)

可能有一些因素导致节点显示为DOWN。节点由gossip protocol确定为UP或DOWN。在某些环境中,由于网络拥塞或长GC事件,八卦可能会失败。检查DOWN节点上的system.log。这将显示任何GC事件及其持续时间。

增加phi_convict_threshold中的cassandra.yaml值会降低故障检测器的灵敏度。请注意,此值不应设置为高于12。

有关详细信息,请查看failure detection and recovery文档。