我想进一步了解receiver
。我想知道什么是用于从kafka提取数据的kafka流处理器的kafka stream processor
。
据我所知,kafka流处理器在内部创建了一个kafka Consumer客户端,该客户端从kafka中获取数据(并调用frequency of polling
)。
因此,当第一次调用poll()
时,下次再次调用它来从kafka中获取数据是什么?每秒是否发生多次?我怎么知道poll()被调用了多少次(用于从kafka中获取数据)。
任何有助于理解这一点的方法都会有很大帮助。
答案 0 :(得分:1)
关于poll()
的调用频率没有绝对数字。有多个因素会影响poll()
的调用频率。作为简化模型,您可以假设调用poll()
,获取N条记录,并在处理完所有N条记录后再次调用。
Kafka Streams收集指标来告诉您poll()
的调用频率,因此您可以轻松地监视它:https://docs.confluent.io/current/streams/monitoring.html
答案 1 :(得分:0)
默认情况下,Kafka将等待100毫秒。但是您可以通过更新https://kafka.apache.org/documentation/#streamsconfigs中提到的“ poll.ms”来配置它。