我们有HDP群集-2.6.4和ambari 2.6.1版本
我们有3个版本10.1的kafka代理和3个zookeeper服务器
我们在/var/log/kafka/server.log中看到许多错误消息,如下所示:
在此示例中,我们有6601条关于以下内容的错误行:
This server is not the leader for that topic-partition
示例
[2019-01-06 14:56:53,312] ERROR [ReplicaFetcherThread-0-1011], Error for partition [topic1-example,34] to broker 1011:org.apache.kafka.common.errors.NotLeaderForPartitionException: This server is not the leader for that topic-partition. (kafka.server.ReplicaFetcherThread)
我们检查kafka代理之间的连接性和连接性是否正常(我们在Linux kafka机器上验证了/ var / log / messages和dmesg)
我们还怀疑kafka代理上的zookeeper客户端与Zookeeper服务器之间的连接
但是我们不知道如何检查kafka上的客户端与Zookeeper服务器之间的关系
我们也知道kafka将心跳发送到zookeeper服务器(我认为心跳值为2秒),但是我们不确定这是否是寻找导致领导者消失的原因的正确方向
任何想法是什么原因-卡夫卡经纪人不是主题划分的领导者?
其他相关链接
kafka : one broker keeping print INFO log : "NOT_LEADER_FOR_PARTITION"