Python中基于汇合kafka的消费者不起作用

时间:2018-03-04 19:19:15

标签: python apache-kafka confluent-kafka

kafka和Avro非常新。我遇到了问题,似乎无法弄清楚这里出了什么问题。我曾写过一个使用Avro作为序列化格式的kafka的制作人和消费者。生产者代码正常工作。当我运行kafka-avro-console-consumer时运行该代码后,它给我如下 -

bin/kafka-avro-console-consumer --bootstrap-server localhost:9092 --topic test --property schema.registry.url=http://127.0.0.1:8081 --from-beginning
{"name":{"string":"Hello World!"}}
{"name":{"string":"Hello World!"}}
{"name":{"string":"Hello World!"}}

但是,当我尝试使用python执行相同操作时(遵循最基本的example),我编写以下代码 -

from confluent_kafka import KafkaError
from confluent_kafka.avro import AvroConsumer
from confluent_kafka.avro.serializer import SerializerError


class AvroConsumerAdapter(object):

    def __init__(self, topic='test'):
        self.topic = topic
        self.consumer = AvroConsumer({'bootstrap.servers': 'localhost:9092',
                                      'schema.registry.url': 'http://127.0.0.1:8081',
                                      'group.id': 'mygroup'})
        self.consumer.subscribe([topic])

    def start_consuming(self):
        running = True
        while running:
            try:
                msg = self.consumer.poll(10)
                if msg:
                    print(msg.value())
                    if not msg.error():
                        print("Here - 1")
                        print(msg.value())
                    elif msg.error().code() != KafkaError._PARTITION_EOF:
                        print("here-2")
                        print(msg.error())
                        running = False
                    else:
                        print('Here-3')
                        print(msg.error())
            except SerializerError as e:
                print("Message deserialization failed for %s: %s" % (msg, e))
                running = False
            except Exception as ex:
                print(ex)
                running = False

        self.consumer.close()

这位客户永远呆在那里,从不打印任何东西。我不确定这里有什么问题。任何人都可以帮助我。

1 个答案:

答案 0 :(得分:1)

查看topic config options - 如果要处理主题中当前的所有数据,则需要设置auto.offset.reset': 'smallest'。默认情况下它是largest,这意味着它只显示生成的新行数据。您可以通过让当前的Python代码保持运行并向主题生成新消息来验证这一点 - 您应该看到Python代码选择它们。