您好我一直在尝试学习KAFKA并且遇到远程轮询/消费者的问题。
我已在AWS EC2实例中使用私有和公共IP设置了KAFKA。我的server.properties看起来像这样。
listeners=PLAINTEXT://172.31.31.58:9092 #AWS Private IP
advertised.listeners=PLAINTEXT://35.??.??.??:9092 #AWS Public IP Masked
我的AWS EC2安全组配置为允许任何端口上的任何IP上的流量用于测试目的。
当我使用以下脚本在我的EC2实例中本地生成/使用消息时,它可以完美地运行
bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning
但是当我尝试从运行我的Java API的远程笔记本电脑Eclipse代码连接到同一个kafka实例时,我的代码在consumer.poll(100)中永远挂起。我在这里做错了吗?
Properties props = new Properties();
props.put("bootstrap.servers", "35.??.??.??:9092");//my aws public ip configured in advertised.listeners
props.put("group.id", "test123");
props.put("enable.auto.commit", "false");
props.put("auto.commit.interval.ms", "1000");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
consumer.subscribe(Arrays.asList("test"));
while (true) {
ConsumerRecords<String, String> records = consumer.poll(100);
for (ConsumerRecord<String, String> record : records)
System.out.printf("offset = %d, key = %s, value = %s", record.offset(), record.key(), record.value());
}
}
答案 0 :(得分:1)
你确定它会在poll()
中挂起吗?或poll()
只返回空ConsumerRecords
并在while(true)
中循环播放?
默认情况下,如果您没有为组提交任何偏移量,则使用者会在主题末尾开始,因此它只会收到新消息。在这种情况下,如果您要使用主题中已有的消息,则需要将auto.offset.reset
设置为earliest
(就像您在使用--from-beginning
的控制台消费者中所做的那样)
编辑:
如果它实际上卡在poll()
中,则可能是连接问题。要找到答案,最好的方法是在启用日志记录的情况下运行客户端。创建一个包含以下内容的文件:
log4j.rootLogger=DEBUG, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=[%d] %p %m (%c)%n
并使用-Dlog4j.configuration=file:PATH_TO_FILE