如何在Pykafka simpleconsumer中选择起始偏移量?

时间:2017-12-05 17:14:23

标签: python apache-kafka consumer pykafka

在我的kafka集群单分区主题我有一个简单的消费者处理所有传入的消息,如果有关于处理的数据的错误我想以相同的顺序重新处理来自某个偏移(不是开始)的所有消息以修复不一致并保持来自kafka的原始有序消息序列。

有没有办法用Pykafka做到这一点?我不算搞清楚

1 个答案:

答案 0 :(得分:4)

您需要致电reset_offsets()。例如:

consumer = topic.get_simple_consumer(consumer_group="example")
partition_offset_pairs = [(p, get_offset_for_partition(p)) for p in consumer.partitions.itervalues()]
# because we passed in a consumer_group the new offsets will be saved in Kafka
consumer.reset_offsets(partition_offsets=partition_offset_pairs)

(其中get_offset_for_partition()是您定义的函数)。或者对于单分区主题:

# read from offset 123456
consumer = topic.get_simple_consumer()
partition = topic.partitions[0]
consumer.reset_offsets([(partition, 123456)])

同样的reset_offsets()方法也适用于BalancedConsumer& ManagedBalanceConsumer课程。

请注意,作为Kafka设计的一部分,只能为每个主题分区单独保证消息。