我们有一个由5个经纪人(r5.xlarge)组成的Kafka集群。昨天,我们使用Debezium开始了生产数据库快照,该快照基本上将整个数据库转储到Kafka主题中。 我可以看到,在我们的任何代理中,CPU利用率从未超过30%。另外,“网络输入”字节的峰值约为350 Mbps。
现在某个午夜某个时间,即使我在所有经纪人中都将ulimit设置为unlimited,我们的经纪人之一也因为太多打开文件异常而失败。我不了解此设置正在成为瓶颈。是经纪人数目吗?或磁盘吞吐量?还是网络?
我有一些想法:
请帮助。
答案 0 :(得分:1)
事实证明,在/etc/security/limits.conf中设置的最大打开文件限制不适用于我正在运行的Kafka服务。 Why so?
要检查为任何流程设置的限制,我们都可以
ps ax | grep kafka.Kafka
对于我的Kafka进程,它设置为默认值4096。
为了增加此限制,我添加了一行
ulimit -n 1000000
就在服务文件中开始kafka进程之前,一切正常!