如何在Kafka流中创建一个HashMap作为值的状态存储?

时间:2016-08-29 05:52:25

标签: apache-kafka-streams

我需要使用String键HashMap创建一个状态存储作为值。我尝试了以下两种方法。

// First method
StateStoreSupplier avgStoreNew = Stores.create("AvgsNew")
          .withKeys(Serdes.String())
          .withValues(HashMap.class)
          .persistent()
          .build();

// Second method
HashMap<String ,Double> h = new HashMap<String ,Double>();

StateStoreSupplier avgStore1 = Stores.create("Avgs")
          .withKeys(Serdes.String())
          .withValues(Serdes.serdeFrom(h.getClass()))
          .persistent()
          .build();

代码编译正常,没有任何错误,但我收到运行时错误

io.confluent.examples.streams.WordCountProcessorAPIException in thread "main" java.lang.IllegalArgumentException: Unknown class for built-in serializer

有人可以建议我创建状态商店的正确方法是什么?

1 个答案:

答案 0 :(得分:5)

如果要创建状态存储,则需要为要使用的类型提供序列化程序反序列化程序类。在Kafka Stream中,有一个名为 Serde 的抽象,它将序列化器和反序列化器包装在一个类中。

如果您使用.withValues(Class<K> keyClass),则必须保留

  

@param keyClass键的类,它必须是Kafka内置serdes的类型之一

由于Serdes没有内置HashMap,您需要首先实现一个(可能称为HashMapSerde)并将此类提供给方法.withValues(Serde<K> keySerde)。此外,您还必须为HashMap实现实际的序列化器和反序列化器。如果您知道HashMap的泛型类型,则应指定它们(使序列化器和反序列化器的实现更加简单。

像这样的东西(只是草图;省略了泛型类型):

import org.apache.kafka.common.serialization.Serde;
import org.apache.kafka.common.serialization.Serializer;
import org.apache.kafka.common.serialization.Deserializer;

public class HashMapSerde implements Serde<HashMap> {

    void configure(Map<String, ?> configs, boolean isKey) {
        /* put your code here */
    }

    void close() {
        /* put your code here */
    }

    Serializer<HashMap> serializer() {
        return new Serializer<HashMap>() {
            public void configure(Map<String, ?> configs, boolean isKey) {
                /* put your code here */
            }

            public byte[] serialize(String topic, T data) {
                /* put your code here */
            }

            public void close() {
                /* put your code here */
            }
        };
    }

    Deserializer<HashMap> deserializer() {
        return new Deserializer<HashMap>() {
            public void configure(Map<String, ?> configs, boolean isKey) {
                /* put your code here */
            }

            public T deserialize(String topic, byte[] data) {
                /* put your code here */
            }

            public void close() {
                /* put your code here */
            }
        };
    }
}

如果您想查看有关如何实施(反)序列化工具和Serde的示例,请查看https://github.com/apache/kafka/tree/trunk/clients/src/main/java/org/apache/kafka/common/serializationhttps://github.com/apache/kafka/blob/trunk/clients/src/main/java/org/apache/kafka/common/serialization/Serdes.java