卡夫卡最后X分钟的实时平均值

时间:2018-05-10 20:19:45

标签: java apache-kafka apache-kafka-streams

我在单个代理上有一个主题,其中不断传入有关用户点击的数据。我希望能够近乎实时地计算每个用户最近X分钟的平均点击次数(例如1秒)。

我尝试使用Kafka流进行此操作,但问题是缩略图窗口无法近乎实时计算并且每隔一秒更新所有值的最后平均值。跳跃窗口也许适合,但是对于跳跃= 1秒和一个5分钟的窗口,它将创建300个窗口,我想从性能方面来看太多了。

有没有办法在没有第三方流媒体引擎的情况下做Spark,但有"普通" Kafka API? (Kafka流媒体是可选的)。

非常感谢!

0 个答案:

没有答案