我正在寻找一种从多个设备收集指标数据的方法。数据应由多个" group by"聚合。喜欢的功能。聚合函数列表不完整,稍后将添加新聚合,并且需要聚合从第一天收集的所有数据。
创建具有100年有效期的Kafka主题并将其用作此目的的数据存储区是否可以?因此,新的聚合将能够从主题开始阅读,而现有的聚合将从他们的偏移中继续?
答案 0 :(得分:2)
原则上,是的,你可以使用Kafka进行长期存储,正是因为你概述的原因 - 重新处理源数据以获得额外的聚合/计算。
一些参考文献:
答案 1 :(得分:1)
如果您想保留数据,可以将保留时间增加到较大值。
我仍然建议您制定尺寸保留政策,以确保您的磁盘空间不足