我有一个Kafka-Broker,其中包含多个主题,每个主题都有一个分区。
我有一个消费者可以很好地使用来自主题
的消息我的问题是我需要通过增加分区数量来改善消息队列的吞吐量,比如我在一个主题上有四个分区,有没有办法可以写出四个消费者,每个消费者指向一个分区上的主题???
import java.util.*;
import kafka.consumer.Consumer;
import kafka.consumer.ConsumerConfig;
import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;
public class KafkaConsumer {
private ConsumerConnector consumerConnector = null;
private final String topic = "mytopic";
public void initialize() {
Properties props = new Properties();
props.put("zookeeper.connect", "localhost:2181");
props.put("group.id", "testgroup");
props.put("zookeeper.session.timeout.ms", "400");
props.put("zookeeper.sync.time.ms", "300");
props.put("auto.commit.interval.ms", "1000");
ConsumerConfig conConfig = new ConsumerConfig(props);
consumerConnector = Consumer.createJavaConsumerConnector(conConfig);
}
public void consume() {
//Key = topic name, Value = No. of threads for topic
Map<String, Integer> topicCount = new HashMap<String, Integer>();
topicCount.put(topic, new Integer(1));
//ConsumerConnector creates the message stream for each topic
Map<String, List<KafkaStream<byte[], byte[]>>> consumerStreams =
consumerConnector.createMessageStreams(topicCount);
// Get Kafka stream for topic 'mytopic'
List<KafkaStream<byte[], byte[]>> kStreamList =
consumerStreams.get(topic);
// Iterate stream using ConsumerIterator
for (final KafkaStream<byte[], byte[]> kStreams : kStreamList) {
ConsumerIterator<byte[], byte[]> consumerIte = kStreams.iterator();
while (consumerIte.hasNext())
System.out.println("Message consumed from topic
[" + topic + "] : " +
new String(consumerIte.next().message()));
}
//Shutdown the consumer connector
if (consumerConnector != null) consumerConnector.shutdown();
}
public static void main(String[] args) throws InterruptedException {
KafkaConsumer kafkaConsumer = new KafkaConsumer();
// Configure Kafka consumer
kafkaConsumer.initialize();
// Start consumption
kafkaConsumer.consume();
}
}
答案 0 :(得分:3)
基本上,您需要做的就是启动几个属于同一个消费者群体的消费者。如果您正在使用kafka 0.9或更高版本的新消费者,或者您正在使用高级消费者,那么kafka将负责划分分区,确保每个分区都由一个消费者读取。如果您有比消费者更多的分区,则某些消费者将从多个分区接收消息,但是同一个消费者组中的多个消费者将不会读取任何分区,以确保消息不会重复。所以你永远不会想要比分区更多的消费者,因为有些消费者会闲着。您还可以使用简单消费者https://cwiki.apache.org/confluence/display/KAFKA/0.8.0+SimpleConsumer+Example
微调哪个消费者读取每个分区您似乎正在使用Kafka 0.8或之前的旧消费者。您可能需要考虑切换到新的消费者。 http://kafka.apache.org/documentation.html#intro_consumers
这是另一篇很好的文章,其中详细介绍了使用新消费者撰写消费者的示例:http://www.confluent.io/blog/tutorial-getting-started-with-the-new-apache-kafka-0-9-consumer-client/