我在群集中有四个节点,我需要同步它们。当节点BRJGSD309173尝试通过JGROUPs向BRJGSD333007发送消息时,服务器BRJGSD333007通知以下消息:
11:34:07,759 WARN [org.jgroups.protocols.pbcast.NAKACK](Incoming-2,maestroCacheManager,BRJGSD333007-24075)BRJGSD333007-24075:从BRJGSD309173-7667丢失了4787消息(发送者不在表格中[BRJGSD333007- 24075]),view = [BRJGSD333007-24075 | 0] [BRJGSD333007-24075]
以下配置eh jgroups_tcp.xml
<?xml version='1.0'?>
<config>
<TCP bind_port="7800"
max_bundle_size="5M" />
<TCPPING timeout="3000"
initial_hosts="brjgsm10.weg.net[7800],brjgsm11.weg.net[7800],brjgsd309173.weg.net[7800],brjgsd333007.weg.net[7800]"
port_range="10"
num_initial_members="5"/>
<VERIFY_SUSPECT timeout="1500" />
<pbcast.NAKACK use_mcast_xmit="false"
retransmit_timeout="300,600,1200,2400,4800"
discard_delivered_msgs="true"/>
<pbcast.STABLE stability_delay="1000" desired_avg_gossip="50000" max_bytes="400000"/>
<pbcast.GMS print_local_addr="true" join_timeout="5000" view_bundling="true"/>
</config>
和ehcache.xml的片段
<ehcache xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
updateCheck="false" xsi:noNamespaceSchemaLocation="ehcache.xsd" name="maestroCacheManager">
...
<cache
name="objectServiceExecute"
maxEntriesLocalHeap="100000"
eternal="false" >
<cacheEventListenerFactory
class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
properties="replicateAsynchronously=true, replicatePuts=true,
replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
</cache>
<diskStore
path="java.io.tmpdir/ehcache" />
<cacheManagerPeerProviderFactory
class="net.sf.ehcache.distribution.jgroups.JGroupsCacheManagerPeerProviderFactory"
properties="file=jgroups_tcp.xml"
propertySeparator=";"
/>
<cache
name="org.hibernate.cache.internal.StandardQueryCache"
maxElementsInMemory="10000000"
eternal="true"
memoryStoreEvictionPolicy="LRU" />
<defaultCache
maxElementsInMemory="10000000"
eternal="true"
memoryStoreEvictionPolicy="LRU" >
<cacheEventListenerFactory
class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
properties="replicateAsynchronously=true, replicatePuts=true,
replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
</defaultCache>
</ehcache>
答案 0 :(得分:2)
这是一个非常标准的JGroups配置!您错过了失败检测协议UNICAST3
和MERFGE3
等等!
上述错误意味着您收到了来自不在群集中的成员的消息,因此它已被删除。为什么该成员不在群集中尚不清楚,也许它没有正确加入。由于您没有拥有任何故障检测协议,因此无法将其排除在外。
我建议使用JGroups附带的tcp.xml
副本,并将TCPPING
替换为您的TCPPING
配置。还要确保在bind_addr
中设置TCP
,以确保JGroups绑定到正确的接口。
希望这有帮助, 干杯