Question

我在消费者群组中查询来自Kafka的消息时遇到问题。我的使用者对象使用

分配给给定的分区

self.ps = TopicPartition(topic, partition )

然后消费者分配给该分区：

self.consumer.assign([self.ps])

之后，我可以使用

计算分区内的消息

self.consumer.seek_to_beginning(self.ps)
pos = self.consumer.position(self.ps)

和self.consumer.seek_to_end(self.ps) .....

在我的主题中有超过30000条消息。问题是我只收到一条消息。

消费者配置： max_poll_records= 200 AUTO_OFFSET_RESET是最早的

这是我的功能，我试图得到消息：

 def poll_messages(self):


    data = []

    messages = self.consumer.poll(timeout_ms=6000)


    for partition, msgs in six.iteritems(messages):

        for msg in msgs:

            data.append(msg)

    return data

即使我在开始轮询消息之前转到第一个可用的偏移量我只收到一条消息。

self.consumer.seek(self.ps, self.get_first_offset())

我希望有人可以解释我做错了什么。提前谢谢。

祝福 JORN

Answer 1

我相信你误解了max_poll_records - 这并不意味着你每次投票会得到200，只是你可能获得的最多限制。您需要多次调用poll。我会向您推荐一些简单示例的文档：http://kafka-python.readthedocs.io/en/master/usage.html

我认为更标准的实现是：

for message in self.consumer:
  # do stuff like:
  print(msg)

使用python的Kafka Consumer轮询消息

1 个答案: