我的问题是起搏器。例如,起搏器群集有两个资源,其中一个正在启动,例如需要3分钟,然后在这3分钟内,如果另一个资源监视器失败,它将不会立即调用停止/启动方法重启但是等待第一个资源开始完成。第一个资源完全启动后,第二个资源开始重启,有谁知道为什么?非常感谢你! 我的群集版本: corosync 2.3.4 心脏起搏器1.1.13
答案 0 :(得分:0)
我的群集配置如下。对于调试,我已将“sleep 60”添加到ocf的函数start。
crm configure show
node 168002177: 192.168.2.177
node 168002178: 192.168.2.178
node 168002179: 192.168.2.179
primitive fm_mgt fm_mgt \
op monitor interval=20s timeout=120s \
op stop interval=0 timeout=120s on-fail=restart \
op start interval=0 timeout=120s on-fail=restart \
meta target-role=Started
primitive logserver logserver \
op monitor interval=20s timeout=120s \
op stop interval=0 timeout=120s on-fail=restart \
op start interval=0 timeout=120s on-fail=restart \
meta target-role=Started
clone fm_mgt_replica fm_mgt
clone logserver_replica logserver
property cib-bootstrap-options: \
have-watchdog=false \
dc-version=1.1.13-10.el7-44eb2dd \
cluster-infrastructure=corosync \
stonith-enabled=false \
start-failure-is-fatal=false
答案 1 :(得分:0)
当我在177节点上杀死fm_mgt服务,然后在177上杀死logserver服务时,fm_mgt start需要至少一个minite,在这个minite中,logserver将不会重启,直到fm_mgt完全恢复。
#http://pandas.pydata.org/pandas-docs/stable/timeseries.html#timestamp-limitations
mask = ~df.iloc[:, 3].str.replace('-','').str[:8].astype(int).between(16770921, 22620411)
print (mask)
0 True
1 False
2 True
Name: date_col, dtype: bool
df.iloc[:, 3] = pd.to_datetime(df.iloc[:, 3].mask(mask, '2000-01-01'))
print (df)
col1 col2 col3 date_col
0 123 0 foo 2000-01-01
1 456 1 bar 2017-09-15
2 789 1 psi 2000-01-01