Akka Cluster删除心跳连接消息

时间:2013-05-29 15:34:51

标签: akka akka-cluster

的INFO消息是什么?
FailureDetector(akka://MyCluster) - Remove heartbeat connection [akka://MyCluster@127.0.0.1:35250]

在Akka集群中意味着什么?我似乎无法在文档中找到任何内容。我在测试机器上运行大量JVM时会看到这一点,但不确定这是否是一个需要某种Akka或Linux调优的坏迹象。

Oracle JDK 1.7上的Akka 2.1.4

更新 按照@cmbaxter的建议,我研究了调整心跳的选项。我发现增加/减少与心跳相关的时间对“删除心跳连接”消息的存在没有影响。但是,我注意到'由成员监控'配置设置。我现在相信这些消息表明从特定节点监视心跳正在从一个ActorSystem传递到另一个ActorSystem。因此,他们表明当前的系统只是声明它不再是它自己的责任,而是指出任何类型的连接警告。实际上,在系统启动期间,第一个节点接收了很多“第一个心跳”,然后根据“由成员监视”设置删除大部分节点,因为负载被传递给其他节点节点

1 个答案:

答案 0 :(得分:1)

您看到的消息来自Akka的AccrualFailureDetector课程。根据文件:

The nodes in the cluster monitor each other by sending heartbeats to detect if a
node is unreachable from the rest of the cluster. The heartbeat arrival times is 
interpreted by an implementation of The Phi Accrual Failure Detector.

我的猜测是,群集节点(在本地运行,在端口35250上)已经变得无法访问足够多次,以至于它已被视为不再是群集的一部分。发生这种情况时,将删除对该节点的心跳检查,从而您会看到此消息。如果您认为此节点无法访问,因此不应从群集心跳中删除,则可能存在问题。有关如何调整故障检测的详细信息,请查看Failure Detector部分下的群集文档here