EhCache的JGROUP中出错,丢弃消息发送者不在表中

时间:2016-02-16 13:47:21

标签: java hibernate wildfly ehcache jgroups

我在群集中有四个节点,我需要同步它们。当节点BRJGSD309173尝试通过JGROUPs向BRJGSD333007发送消息时,服务器BRJGSD333007通知以下消息:

  

11:34:07,759 WARN [org.jgroups.protocols.pbcast.NAKACK](Incoming-2,maestroCacheManager,BRJGSD333007-24075)BRJGSD333007-24075:从BRJGSD309173-7667丢失了4787消息(发送者不在表格中[BRJGSD333007- 24075]),view = [BRJGSD333007-24075 | 0] [BRJGSD333007-24075]

以下配置eh jgroups_tcp.xml

<?xml version='1.0'?>
 <config>
     <TCP bind_port="7800" 
          max_bundle_size="5M" />
     <TCPPING timeout="3000"
              initial_hosts="brjgsm10.weg.net[7800],brjgsm11.weg.net[7800],brjgsd309173.weg.net[7800],brjgsd333007.weg.net[7800]"
              port_range="10"
              num_initial_members="5"/>
     <VERIFY_SUSPECT timeout="1500"  />
     <pbcast.NAKACK use_mcast_xmit="false"
                    retransmit_timeout="300,600,1200,2400,4800"
                discard_delivered_msgs="true"/>
     <pbcast.STABLE stability_delay="1000" desired_avg_gossip="50000" max_bytes="400000"/>
     <pbcast.GMS print_local_addr="true" join_timeout="5000" view_bundling="true"/>
 </config>

和ehcache.xml的片段

<ehcache xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    updateCheck="false" xsi:noNamespaceSchemaLocation="ehcache.xsd" name="maestroCacheManager">
...
    <cache 
        name="objectServiceExecute"
        maxEntriesLocalHeap="100000" 
        eternal="false" >
        <cacheEventListenerFactory
              class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
              properties="replicateAsynchronously=true, replicatePuts=true,
              replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
    </cache>

    <diskStore 
        path="java.io.tmpdir/ehcache" />

    <cacheManagerPeerProviderFactory
        class="net.sf.ehcache.distribution.jgroups.JGroupsCacheManagerPeerProviderFactory"
        properties="file=jgroups_tcp.xml"
        propertySeparator=";" 
    /> 

    <cache 
        name="org.hibernate.cache.internal.StandardQueryCache" 
        maxElementsInMemory="10000000" 
        eternal="true" 
        memoryStoreEvictionPolicy="LRU" />

    <defaultCache 
        maxElementsInMemory="10000000" 
        eternal="true"
        memoryStoreEvictionPolicy="LRU" >
        <cacheEventListenerFactory
              class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
              properties="replicateAsynchronously=true, replicatePuts=true,
              replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
    </defaultCache>

</ehcache>

1 个答案:

答案 0 :(得分:2)

这是一个非常标准的JGroups配置!您错过了失败检测协议UNICAST3MERFGE3等等!

上述错误意味着您收到了来自不在群集中的成员的消息,因此它已被删除。为什么该成员不在群集中尚不清楚,也许它没有正确加入。由于您没有拥有任何故障检测协议,因此无法将其排除在外。

我建议使用JGroups附带的tcp.xml副本,并将TCPPING替换为您的TCPPING配置。还要确保在bind_addr中设置TCP,以确保JGroups绑定到正确的接口。

希望这有帮助, 干杯