如何在k-safety评估失败时延迟Vertica节点关闭?

时间:2017-08-04 10:08:26

标签: vertica

我们正在使用3个节点的Vertica群集。 节点之间的网络连接有时会在很短的时间内失败(例如:10秒)。

发生这种情况时,一旦检测到其他节点无法访问,所有节点都会立即快速关闭(因为无法满足k-safety)。例如,node0003在vertica日志中记录以下序列:

00:04:30.633 node v_feedback_node0001 left the cluster
...
00:04:30.670 Node left cluster, reassessing k-safety...
...
00:04:32.389 node v_feedback_node0002 left the cluster
...
00:04:32.414 Changing node v_feedback_node0003 startup state from UP to UNSAFE
...
00:04:33.425 Shutting down this node
...
00:04:38.547 node v_feedback_node0003 left the cluster

是否可以配置延迟,之后每个节点在放弃和关闭之前都会尝试重新连接到其他节点?

1 个答案:

答案 0 :(得分:0)

Vertica forum上获得了Vertica员工的回答。

  

此[重新连接延迟]时间被硬编码为8秒。

     

我认为花时间更好地使网络更可靠。 30秒   网络故障是很多(我的意思是真的,非常大,通常   network rtt是在微秒内)。即使你保持垂直   推迟k安全评估,没有什么可以连接到   数据库,或者很可能所有数据库连接都可能重置。