心脏起搏器corosync服务被忽略了

时间:2014-10-16 12:15:17

标签: cluster-computing pacemaker

两个节点群集节点A,节点B.

在节点A上运行的服务X,节点B是DC。

我们正在与Pacemaker一起使用堆栈corosync。 失败超时是10秒。 目标角色已启动。

事件就是这样发生的 节点A向节点B发送事件服务X已关闭 节点B打印忽略服务X的过期故障 此服务X之后永远不会重新启动。

现在问题是:

  1. 为什么Node B(DC)忽略过期的故障?
  2. 即使此时DC被忽略,但是当服务X关闭时,节点A应监视该服务并再次向节点B发送故障状态,此时节点B应重新启动该服务。为什么不这样做?

2 个答案:

答案 0 :(得分:3)

其中一个原因可能是两台服务器(DC和其他机器)之间的时差。

所以,DC认为这个事件已经过时并且忽略了它。请同步时间,然后尝试重新创建问题。

答案 1 :(得分:1)

您可以将以下属性添加到您的crm配置中,该配置将尝试启动失败的过期资源。

 start-failure-is-fatal="false"
相关问题