致所有Cassandra专家,
我正在尝试了解cassandra故障检测和恢复。我对这是如何运作有点困惑。
来自Datastax Doc:
配置phi_convict_threshold属性可调整故障检测器的灵敏度。较低的值会增加无响应节点被标记为关闭的可能性,而较高的值会降低导致节点故障的瞬态故障的可能性。在不稳定的网络环境中(例如EC2有时),将值提高到10或12有助于防止错误的故障。
来自http://ljungblad.nu/post/44006928392/cassandra-and-its-accrual-failure-detector
Phi表示节点A关于节点B状态的错误的可能性.Phi越高,节点B失败的可信度越大。
有人可以详细解释我C *故障检测机制以及C *如何在不同情况下恢复它。
提前致谢
Chaity
答案 0 :(得分:3)
我不认为自己是 Cassandra专家,但这是我对Cassandra 节点故障检测的看法:
当节点脱机或性能不佳时,所有这些通信方法都可以协同工作,并且可以进行配置。据我所知,Cassandra不会在失败后恢复生命;这需要人工干预才能使节点重新联机并运行 nodetool 来修复故障节点上的数据。
根据您的组织对读写操作的容错能力,您始终可以配置一致性级别。
用于管理节点故障的一些资源: