领导更换后,春季Kafka消费者不承诺使用Kafka服务器

时间:2019-01-24 10:37:05

标签: apache-kafka kafka-consumer-api kafka-producer-api spring-kafka

我正在使用spring-kafka 2.1.10.RELEASE。我有一个具有下一个属性的消费者(几乎全部复制):

    auto.commit.interval.ms = 5000
    auto.offset.reset = earliest
    bootstrap.servers = [kafka1.local:9093, kafka2.local:9093, kafka3.local:9093]
    check.crcs = true
    client.id = kafkaListener-0
    connections.max.idle.ms = 540000
    enable.auto.commit = true
    exclude.internal.topics = true
    fetch.max.bytes = 52428800
    fetch.max.wait.ms = 500
    fetch.min.bytes = 1
    group.id = kafkaLisneterContainer
    heartbeat.interval.ms = 3000
    interceptor.classes = null
    internal.leave.group.on.close = true
    isolation.level = read_uncommitted
    max.poll.interval.ms = 300000
    max.poll.records = 50
    metadata.max.age.ms = 300000
    metrics.num.samples = 2
    metrics.recording.level = INFO
    metrics.sample.window.ms = 30000
    partition.assignment.strategy = [class org.apache.kafka.clients.consumer.RangeAssignor]
    receive.buffer.bytes = 65536
    reconnect.backoff.max.ms = 1000
    reconnect.backoff.ms = 50
    request.timeout.ms = 305000
    retry.backoff.ms = 100
    sasl.jaas.config = null
    sasl.kerberos.kinit.cmd = /usr/bin/kinit
    sasl.kerberos.min.time.before.relogin = 60000
    sasl.kerberos.service.name = null
    sasl.kerberos.ticket.renew.jitter = 0.05
    sasl.kerberos.ticket.renew.window.factor = 0.8
    sasl.mechanism = GSSAPI
    security.protocol = PLAINTEXT
    send.buffer.bytes = 131072
    session.timeout.ms = 10000
    ssl.cipher.suites = null
    ssl.enabled.protocols = [TLSv1.2, TLSv1.1, TLSv1]
    ssl.endpoint.identification.algorithm = null
    ssl.key.password = null
    ssl.keymanager.algorithm = SunX509
    ssl.keystore.location = null
    ssl.keystore.password = null
    ssl.keystore.type = JKS
    ssl.protocol = TLS
    ssl.provider = null
    ssl.secure.random.implementation = null
    ssl.trustmanager.algorithm = PKIX
    ssl.truststore.location = null
    ssl.truststore.password = null
    ssl.truststore.type = JKS

我的产品上的Apache Kafka版本是2.11-1.0.0-0pan4。 有一个包含3个kafka节点的集群:

enter image description here

遇到了一个严重的问题,甚至无法在本地复制它。这就是发生的事情:

  1. 我使用kafka Producer和Consumer来启动我的应用程序。

  2. 一切正常,直到我的主题的领导节点在2019-01-17 06:47:39都没有改变:

  

2019-01-17 / controller.2019-01-17-03.aaa-aa3.gz:2019-01-17 06:47:39,365   +0000 [控制器事件线程] [kafka.controller.KafkaController]信息[Controller id = 3]分区topic_name-0的新领导者和ISR   是{“ leader”:1,“ leader_epoch”:3,“ isr”:[1,3]}   (kafka.controller.KafkaController)

  1. 此后,我的消费者停止向Kafka提交补偿。上一次提交发生在更换领导者的同一小时和同一分钟-2019年1月17日06:47。 enter image description here

4)最神秘的事情:在应用程序中,一切都很好-可以。春季消费者读取新消息并将其发送给kafka。我看到这样的日志。好像spring消费者将其偏移量保存在内存中,然后将提交发送到远程kafka(无错误等):

  

2019-01-23 14:03:20,975 +0000   [kafkaLisneterContainer-0-C-1] [Fetcher]调试[消费者   clientId = kafkaListener-0,   groupId = kafkaLisneterContainer]在以下位置读取READ_UNCOMMITTED   分区aaa-1返回的提取数据的偏移量164871   (错误= NONE,highWaterMark = 164871,lastStableOffset = -1,   logStartOffset = 116738,abortedTransactions = null,   recordsSizeInBytes = 0)2019-01-23 14:03:20,975 +0000
  [外部投注] [kafkaLisneterContainer-0-C-1] [Fetcher]   调试[消费者clientId = kafkaListener-0,   groupId = kafkaLisneterContainer]已添加READ_UNCOMMITTED获取   请求将eaaa-1分区偏移到节点164871   aaa-aa1.local:9093(id:1 rack:null)2019-01-23 14:03:20,975

5)但是无论如何,Apache kafka中的滞后会增长。而且,如果我重新启动应用程序,则将重新创建spring bean使用者,并将丢失其内存中保存的偏移量。它将读取来自kafka的延迟并第二次处理该记录。

请帮忙寻找钥匙!

1 个答案:

答案 0 :(得分:2)

启用自动提交(Kafka的默认设置)后,提交将完全由kafka-clients管理,而Spring无法对其进行控制。

将其设置为false将允许侦听器容器在默认情况下提交每批记录(轮询结果)之后或在设置了容器AckMode的每个记录之后将执行的偏移量到RECORD

当由于重新平衡而撤销分区时,容器还将可靠地提交任何待处理的偏移量。

我通常建议不要使用自动提交。