卡夫卡流不时停止运行

时间:2020-09-18 19:40:37

标签: apache-kafka apache-kafka-streams spring-kafka

我们有两个在分布式应用程序上运行的kafka流。即我们有三台服务器(消费者)作为流dockerized微服务的一部分运行,每台服务器将运行两个流(streams-1和streams-2)。现在,通常所有三个服务器都将以相同的指标运行,例如大约30%的CPU,但是有时,一台服务器的运行速度会达到100%,其他服务器会下降到10%。发生这种情况时,我还看到两个流都建立了巨大的滞后,实际上,我只能看到100%CPU使用者作为该流的使用者组的一部分运行。重新启动后,问题得到解决,但是这种情况时有发生,我不知道为什么。如果几个小时后仍未解决,则延迟会从100上升到7位数的延迟。

aws的CPU利用率: CPU utilisation from aws

现在所有三个docker实例也会说该容器是健康的(docker ps中的状态)

巨大的卡夫卡滞后:(通常在100年代) Huge kafka lag

配置:我们正在运行kafka 2.3,并且使用了Spring Cloud Stream。 springboot版本2.1.10.RELEASE,spring-cloud Greenwich.SR3和spring-kafka 2.2.11.RELEASE和融合版本5.3.1

0 个答案:

没有答案