在Apache Kafka中设置多个分区

时间:2016-07-26 22:57:31

标签: java apache-kafka apache-zookeeper producer-consumer

我试图从代码中将分区号设置为2,并且我有单节点设置,(1 zookeeper,1kafka)。当我使用消息时,我发现kafka只使用一个分区来存储数据,我是否需要对设置进行任何修改才能拥有多个分区?

 private void setupZookeeper(String[] topicList){

    ZkClient zkClient = null;
    ZkUtils zkUtils = null;
    try {
        String[] zookeeperHosts = {"localhost:2181"}; // If multiple zookeeper then -> String zookeeperHosts = "192.168.20.1:2181,192.168.20.2:2181";
        int sessionTimeOutInMs = 15 * 1000; // 15 secs
        int connectionTimeOutInMs = 10 * 1000; // 10 secs
        //String topicName = "testTopic";
        int noOfPartitions = 2;
        int noOfReplication = 1;

        for(String zookeeper:zookeeperHosts){

            zkClient = new ZkClient(zookeeper, sessionTimeOutInMs, connectionTimeOutInMs, ZKStringSerializer$.MODULE$);
            zkUtils = new ZkUtils(zkClient, new ZkConnection(zookeeper), false);
            for(String topicName: topicList){
                System.out.println("Setting no of partitions ="+noOfPartitions + "for topic" + topicName);
                AdminUtils.createTopic(zkUtils, topicName, noOfPartitions, noOfReplication, 
                         producerConfig(),RackAwareMode.Disabled$.MODULE$);
            }
        }



    } catch (Exception ex) {
        ex.printStackTrace();
    } finally {
        if (zkClient != null) {
            zkClient.close();
        }
    }

我的producerConfig,如下所示:

private Properties producerConfig() {
   Properties props = new Properties();
  props.put("bootstrap.servers", "localhost:9092");

  props.put("acks", "all");
  //props.put("retries", 0);
  props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
  props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

return props;
}

1 个答案:

答案 0 :(得分:1)

  

当我消息时,我看到kafka只使用了一个   用于存储数据的分区

下面的默认消息分区策略“只使用一个分区”可能是由常量消息密钥引起的,计算的哈希值相同,只路由到一个分区。

  • 如果在记录中指定了分区,请使用它;
  • 如果未指定分区但存在密钥,则根据密钥的哈希选择分区;
  • 如果没有分区或密钥,请以循环方式选择分区。