我看到这种行为非常多,在八卦阶段,一个节点无法被发现并提示警告" INET IPADDR现在已经关闭",但几秒后它就会出现。当我检查节点时,它实际上没有关闭,但是不能通过其他节点发现。由于这个问题,提示非常高。
可能导致此错误的原因是什么,以及如何减轻这些错误?
答案 0 :(得分:0)
可能有一些因素导致节点显示为DOWN。节点由gossip protocol确定为UP或DOWN。在某些环境中,由于网络拥塞或长GC事件,八卦可能会失败。检查DOWN节点上的system.log
。这将显示任何GC事件及其持续时间。
增加phi_convict_threshold
中的cassandra.yaml
值会降低故障检测器的灵敏度。请注意,此值不应设置为高于12。
有关详细信息,请查看failure detection and recovery文档。