Spring-amqp - 消息处理延迟

时间:2018-06-06 11:31:24

标签: java spring rabbitmq spring-amqp

我们在RHEL 7.0 VM上部署了一个Java / spring / tomcat应用程序,它使用AlejandroRivera / embedded-rabbitmq,并在部署战争后立即启动Rabbitmq服务器,并连接到它。我们有多个队列用于处理和过滤事件。

流程是这样的:

我们收到的事件 - >发布事件队列 - >监听器类过滤事件 - >发布到另一个队列进行处理                                                                                                                            - >我们发布到另一个队列进行记录。

问题是:

  • 处理正常开始,我们可以看到消息在队列中流动,但经过一段时间后,侦听器类停止接收事件。看起来我们能够将它发布到RabbitMQ通道,但它永远不会从侦听器中排出队列。 这似乎开始降级导致事件在一段时间后被处理,上升到几分钟。负载并不高,大约200个事件,我们关心它只有少数事件。

我们尝试了什么:

  • 最初,队列的预取设置为1 ,消费者 min为2,最多为5 ,我们删除了预取,我们添加了更多的消费者作为最大并发设置,但问题仍然存在,延迟只需要更长的时间来呈现,但几分钟后,处理开始需要大约20/30秒。

我们在日志中看到我们将事件发布到队列中,并且我们看到了日志,我们将它从队列中延迟了。因此,我们的代码中间没有任何内容会产生这种延迟。

据我们所知,其余的队列似乎正确地处理了消息,但是这个消息处于这种卡住模式...

我看到的错误如下,但我会告诉它意味着什么,以及它是否相关:

Jun  4 11:16:04  server: [pool-3-thread-10] ERROR com.rabbitmq.client.impl.ForgivingExceptionHandler - Consumer org.springframework.amqp.rabbit.listener.BlockingQueueConsumer$InternalConsumer@70dfa413 (amq.ctag-VaWc-hv-VwcUPh9mTQTj7A) method handleDelivery for channel AMQChannel(amqp://agent@127.0.0.1:5672/,198) threw an exception for channel AMQChannel(amqp://agent@127.0.0.1:5672/,198)
Jun  4 11:16:04  server: java.io.IOException: Unknown consumerTag
Jun  4 11:16:04  server: at com.rabbitmq.client.impl.ChannelN.basicCancel(ChannelN.java:1266)
Jun  4 11:16:04  server: at sun.reflect.GeneratedMethodAccessor180.invoke(Unknown Source)
Jun  4 11:16:04  server: at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
Jun  4 11:16:04  server: at java.lang.reflect.Method.invoke(Method.java:498)
Jun  4 11:16:04  server: at org.springframework.amqp.rabbit.connection.CachingConnectionFactory$CachedChannelInvocationHandler.invoke(CachingConnectionFactory.java:955)
Jun  4 11:16:04  server: at com.sun.proxy.$Proxy119.basicCancel(Unknown Source)
Jun  4 11:16:04  server: at org.springframework.amqp.rabbit.listener.BlockingQueueConsumer$InternalConsumer.handleDelivery(BlockingQueueConsumer.java:846)
Jun  4 11:16:04  server: at com.rabbitmq.client.impl.ConsumerDispatcher$5.run(ConsumerDispatcher.java:149)
Jun  4 11:16:04  server: at com.rabbitmq.client.impl.ConsumerWorkService$WorkPoolRunnable.run(ConsumerWorkService.java:100)
Jun  4 11:16:04  server: at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
Jun  4 11:16:04  server: at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
Jun  4 11:16:04  server: at java.lang.Thread.run(Thread.java:748)

这个问题发生在关闭应用程序时,但我发现它在应用程序仍在运行时发生..

2018-06-05 13:22:45,443 ERROR CachingConnectionFactory$DefaultChannelCloseLogger - Channel shutdown: channel error; protocol method: #method<channel.close>(reply-code=406, reply-text=PRECONDITION_FAILED - unknown delivery tag 109, class-id=60, method-id=120)

我不确定如何处理这两个错误,也不确定它们是否相关。

这是我的Spring配置:

<!-- Queues -->
<rabbit:queue id="monitorIncomingEventsQueue" name="MonitorIncomingEventsQueue"/>
<rabbit:queue id="interestingEventsQueue" name="InterestingEventsQueue"/>
<rabbit:queue id="textCallsEventsQueue" name="TextCallsEventsQueue"/>
<rabbit:queue id="callDisconnectedEventQueue" name="CallDisconnectedEventQueue"/>
<rabbit:queue id="incomingCallEventQueue" name="IncomingCallEventQueue"/>
<rabbit:queue id="eventLoggingQueue" name="EventLoggingQueue"/>

<!-- listeners -->
<bean id="monitorListener" class="com.example.rabbitmq.listeners.monitorListener"/>
<bean id="interestingEventsListener" class="com.example.rabbitmq.listeners.InterestingEventsListener"/>
<bean id="textCallsEventListener" class="com.example.rabbitmq.listeners.TextCallsEventListener"/>
<bean id="callDisconnectedEventListener" class="com.example.rabbitmq.listeners.CallDisconnectedEventListener"/>
<bean id="incomingCallEventListener" class="com.example.rabbitmq.listeners.IncomingCallEventListener"/>
<bean id="eventLoggingEventListener" class="com.example.rabbitmq.listeners.EventLoggingListener"/>

<rabbit:listener-container connection-factory="connectionFactory" message-converter="defaultMessageConverter" concurrency="5" max-concurrency="40" acknowledge="none">
    <rabbit:listener queues="interestingEventsQueue" ref="interestingEventsListener" method="handleIncomingMessage"/>
</rabbit:listener-container>

<rabbit:listener-container connection-factory="connectionFactory" message-converter="defaultMessageConverter" concurrency="5" max-concurrency="20" acknowledge="none">
    <rabbit:listener queues="textCallsEventsQueue" ref="textCallsEventListener" method="handleIncomingMessage"/>
</rabbit:listener-container>

<rabbit:listener-container connection-factory="connectionFactory" message-converter="defaultMessageConverter" concurrency="5" max-concurrency="20" acknowledge="none">
    <rabbit:listener queues="callDisconnectedEventQueue" ref="callDisconnectedEventListener" method="handleIncomingMessage"/>
</rabbit:listener-container>

<rabbit:listener-container connection-factory="connectionFactory" message-converter="defaultMessageConverter" concurrency="5" max-concurrency="30" acknowledge="none">
    <rabbit:listener queues="incomingCallEventQueue" ref="incomingCallEventListener" method="handleIncomingMessage"/>
</rabbit:listener-container>

<rabbit:listener-container connection-factory="connectionFactory" message-converter="defaultMessageConverter" concurrency="1" max-concurrency="3" acknowledge="none">
    <rabbit:listener queues="monitorIncomingEventsQueue" ref="monitorListener" method="handleIncomingMessage"/>
</rabbit:listener-container>

<rabbit:listener-container connection-factory="connectionFactory" message-converter="defaultMessageConverter" concurrency="5" max-concurrency="10"  acknowledge="none">
    <rabbit:listener queues="EventLoggingQueue" ref="eventLoggingEventListener" method="handleLoggingEvent"/>
</rabbit:listener-container>

<rabbit:connection-factory id="connectionFactory" host="${host.name}" port="${port.number}" username="${user.name}" password="${user.password}" connection-timeout="20000"/>

我在这里读到,处理延迟可能是由网络问题引起的,但在这种情况下,服务器和应用程序位于同一个VM上。这是一个被锁定的环境,所以大多数港口都没有开放,但我怀疑这是错误的。

更多日志:https://pastebin.com/4QMFDT7A

感谢任何帮助,

谢谢,

1 个答案:

答案 0 :(得分:0)

我需要看到更多的日志 - 这是吸烟枪:

Storing...Storing delivery for Consumer@a2ce092: tags=[{}]

(消费者)tags为空,这意味着消费者当时已被取消(出于某种原因,应该出现在日志的前面)。

如果有可能用1.7.9.BUILD-SNAPSHOT重现,我添加了一些TRACE级别的日志记录,这有助于诊断它。

修改

回复您最近对rabbitmq-users的评论......

您可以尝试使用固定并发吗? Spring AMQP容器中的变量并发通常不是很有用,因为如果整个容器空闲一段时间,通常只会减少消费者。

但是,这可能会解释为什么你会看到消费者被取消。

也许这种逻辑中存在一些竞争条件;使用固定数量的消费者(不指定max ...)将避免这种情况;如果你可以尝试,它至少会消除这种可能性。

那就是说,我很困惑(我在Stack Overflow配置中没有注意到这一点);使用acknowledge="none"时,不应向代理发送任何确认(NONE用于设置autoAck

String consumerTag = this.channel.basicConsume(queue, this.acknowledgeMode.isAutoAck(), ...

public boolean isAutoAck() {

    return this == NONE;

}

您是否从代码中发送了消息?如果是这样,ack模式应该是MANUAL。我看不到容器将发送确认为无通道模式的情况。