kafka流多少次调用poll()来从kafka主题中获取记录

时间:2019-05-30 13:35:57

标签: apache-kafka apache-kafka-streams

我想进一步了解receiver。我想知道什么是用于从kafka提取数据的kafka流处理器的kafka stream processor

据我所知,kafka流处理器在内部创建了一个kafka Consumer客户端,该客户端从kafka中获取数据(并调用frequency of polling)。

因此,当第一次调用poll()时,下次再次调用它来从kafka中获取数据是什么?每秒是否发生多次?我怎么知道poll()被调用了多少次(用于从kafka中获取数据)。

任何有助于理解这一点的方法都会有很大帮助。

2 个答案:

答案 0 :(得分:1)

关于poll()的调用频率没有绝对数字。有多个因素会影响poll()的调用频率。作为简化模型,您可以假设调用poll(),获取N条记录,并在处理完所有N条记录后再次调用。

Kafka Streams收集指标来告诉您poll()的调用频率,因此您可以轻松地监视它:https://docs.confluent.io/current/streams/monitoring.html

答案 1 :(得分:0)

默认情况下,Kafka将等待100毫秒。但是您可以通过更新https://kafka.apache.org/documentation/#streamsconfigs中提到的“ poll.ms”来配置它。