使用Kafka主题存储数据多年

时间:2017-10-25 06:59:54

标签: apache-kafka

我正在寻找一种从多个设备收集指标数据的方法。数据应由多个" group by"聚合。喜欢的功能。聚合函数列表不完整,稍后将添加新聚合,并且需要聚合从第一天收集的所有数据。

创建具有100年有效期的Kafka主题并将其用作此目的的数据存储区是否可以?因此,新的聚合将能够从主题开始阅读,而现有的聚合将从他们的偏移中继续?

2 个答案:

答案 0 :(得分:2)

原则上,是的,你可以使用Kafka进行长期存储,正是因为你概述的原因 - 重新处理源数据以获得额外的聚合/计算。

一些参考文献:

答案 1 :(得分:1)

如果您想保留数据,可以将保留时间增加到较大值。

我仍然建议您制定尺寸保留政策,以确保您的磁盘空间不足