如何在Cassandra中实现时间序列数据的差异聚合/汇总

时间:2013-10-15 12:40:54

标签: cassandra time-series

我的情况是,我将从制造计划中的操作设备收集许多时间序列指标(使用的电量,使用的小时数,闲置时间)。我需要在单个和分组资产上创建许多不同的汇总数字。例如,我需要为给定的机器创建超过1,5,10,30天的最小,最大,平均电力。为不同的计算机组创建相同类型的指标....许多计算值来自从资产中检索的原始值。

在Cassandra环境中计算这些值的最佳方法是什么?

  1. 我是否需要创建执行计算的“批处理作业”?
  2. 似乎Cassandra中有一些内置数据类型(计数器),但似乎是一些问题(只是阅读堆栈溢出的一些注释)
  3. 有没有人将Cassandra与Twitter风暴或其他东西整合以不断更新计数器?
  4. 由于

1 个答案:

答案 0 :(得分:1)

有一个名为Blueflood的开源项目就是这样做的。您可以直接使用它来填充您的用例,或者根据需要分配回购并进行修改。

(免责声明:我是该项目的撰稿人)