即使经过很长一段时间,我怎样才能使Jgroup重新连接?

时间:2017-03-07 19:21:38

标签: java jgroups

所以我们遇到一个问题,即12小时内运行的渗透检查器导致Jgroup断开连接,奴隶没有重新加入群集,分裂大脑,其他一些代表缺乏复制的问题,以及它没有恢复。

doubleValue()

版本

<config xmlns="urn:org:jgroups"
        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xsi:schemaLocation="urn:org:jgroups http://www.jgroups.org/schema/JGroups-3.6.xsd">
   <TCP bind_addr="NON_LOOPBACK"
        bind_port="${infinispan.jgroups.bindPort}"
        enable_diagnostics="false"
        thread_naming_pattern="pl"
        send_buf_size="640k"
        sock_conn_timeout="300"

        thread_pool.min_threads="${jgroups.thread_pool.min_threads:2}"
        thread_pool.max_threads="${jgroups.thread_pool.max_threads:30}"
        thread_pool.keep_alive_time="60000"
        thread_pool.queue_enabled="false"

        internal_thread_pool.min_threads="${jgroups.internal_thread_pool.min_threads:5}"
        internal_thread_pool.max_threads="${jgroups.internal_thread_pool.max_threads:20}"
        internal_thread_pool.keep_alive_time="60000"
        internal_thread_pool.queue_enabled="true"
        internal_thread_pool.queue_max_size="500"

        oob_thread_pool.min_threads="${jgroups.oob_thread_pool.min_threads:20}"
        oob_thread_pool.max_threads="${jgroups.oob_thread_pool.max_threads:200}"
        oob_thread_pool.keep_alive_time="60000"
        oob_thread_pool.queue_enabled="false"
   />
   <TCPPING async_discovery="true"
            initial_hosts="${infinispan.jgroups.tcpping.initialhosts}"
            port_range="1"/>
   />
   <MERGE3 min_interval="10000" 
           max_interval="30000" 
   />
   <FD_SOCK />
   <FD />
   <VERIFY_SUSPECT />
   <pbcast.NAKACK2 use_mcast_xmit="false"
                   xmit_interval="1000"
                   xmit_table_num_rows="50"
                   xmit_table_msgs_per_row="1024"
                   xmit_table_max_compaction_time="30000"
                   max_msg_batch_size="100"
                   resend_last_seqno="true"
   />
   <UNICAST3 xmit_interval="500"
             xmit_table_num_rows="50"
             xmit_table_msgs_per_row="1024"
             xmit_table_max_compaction_time="30000"
             max_msg_batch_size="100"
             conn_expiry_timeout="0"
   />
   <pbcast.STABLE stability_delay="500"
                  desired_avg_gossip="5000"
                  max_bytes="1M"
   />
   <pbcast.GMS print_local_addr="true"  join_timeout="15000"/>
   <pbcast.FLUSH />
   <FRAG2 />
</config>

我想知道我们是否可以更改我们的jgroups配置,以便群集节点最终能够重新加入。即使经过12小时的攻击&#34;这样我们就不必重新启动服务器了。

1 个答案:

答案 0 :(得分:0)

请先为我定义 disconnect

关于你的筹码,我有一些建议/问题:

  • 我建议一般使用您使用的版本中的tcp.xml,然后根据需要进行修改
  • TCPPING:initial_hosts是否包含所有集群成员?
  • 用FD_ALL替换FD
  • STABLE:5s的desired_avg_gossip有点小;这会产生比所需更多的流量
  • 15秒的GMS.join_timeout非常高;这是第一个成员的启动时间,它也会影响发现时间
  • 你需要什么FLUSH?