Kafka python使用者在启动时读取所有消息

时间:2016-01-09 07:08:36

标签: python apache-kafka

我使用以下代码来阅读主题中的消息。我面临两个问题。 每当我启动消费者时,它正在读取队列中的所有消息? 如何只读取未读消息?

from kafka import KafkaConsumer


consumer = KafkaConsumer('my-topic',
                         group_id='my-group',
                         bootstrap_servers=['localhost:9092'])
for message in consumer:
    consumer.commit() 
    # message value and key are raw bytes -- decode if necessary!
    # e.g., for unicode: `message.value.decode('utf-8')`
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition,
                                          message.offset, message.key,
                                          message.value))

1 个答案:

答案 0 :(得分:5)

正如@Kenji所说,你必须使用consumer.commit()提交抵消。如果您不想手动提交,可以通过将enable_auto_commit=True传递到KafkaConsumer来启用自动提交。您可能还想调整auto_commit_interval_ms,这是每次自动提交之间的间隔(以毫秒为单位)。见这里:http://kafka-python.readthedocs.org/en/master/apidoc/KafkaConsumer.html