Kafka Streams:在时间窗口中获取事件计数

时间:2020-09-17 17:27:02

标签: apache-kafka apache-kafka-streams

我有数据流作为事件。我想获取10分钟时间窗口内的事件计数并输出到另一个主题。以下是我的代码

StreamsBuilder streamsBuilder = new StreamsBuilder();
streamsBuilder.stream("events")
            .groupByKey()
            .windowedBy(TimeWindows.of(Duration.ofMillis(10000)))
            .count()
            .toStream()
            .to("output");

但是我得到了错误

 ClassCastException while producing data to topic output. A serializer (key: org.apache.kafka.common.serialization.StringSerializer / value: org.apache.kafka.common.serialization.LongSerializer) is not compatible to the actual key or value type (key type: org.apache.kafka.streams.kstream.Windowed / value type: java.lang.Long). Change the default Serdes in StreamConfig or provide correct Serdes via method parameters (for example if using the DSL, `#to(String topic, Produced<K, V> produced)` with `Produced.keySerde(WindowedSerdes.timeWindowedSerdeFrom(String.class))`).

1 个答案:

答案 0 :(得分:2)

windowedBycount() 的结果是 <Windowed<String>, Long> 类型的键值对,因此您需要通过 {{1} 在 to() 中设置不同的 serde } 范围。默认情况下,将使用配置中的 serdes,您似乎将其设置为 Produced,而那些显然与输出主题键/值类型不匹配。

Kafka Streams 附带了用于窗口类型的内置 serdes,您可以通过 StringSerde/StringSerde 工厂类获取。