Question

我在AWS EC2实例上运行的kafka群集一直存在问题。

描述

症状

以下将在随机经纪人的随机间隔发生

这里的日志是我可以收集的信息：

缩小随机代理上的群集内复制（我想这可能是暂时的网络故障但无法提供证据）
系统开始显示接近没有活动@ 02:27:20 （请注意，它在非常安静的时间没有加载相关）
< / LI>
1. 从那里开始，这个kafka经纪人不会处理消息，因为它从集群复制中退出后是预期的IMO。
2. 现在，真正的问题显示为 CLOSE_WAIT 中的连接数不断增加，直到达到系统/流程的配置ulimit，最终导致kafka流程崩溃。

Answer 1

原来我使用的版本出现了僵局。

升级修复了问题。

查看有关此问题的故障单：