RRD时间序列数据

时间:2015-08-28 08:45:34

标签: data-mining rrd

我在一家从智能电表接收数据的公司工作。对于直播流,该数据可以长达2天,并且可以在出现错误(间隙等)的情况下填充后期。目前我们通常存储5年。然后将数据拉入SSAS立方体并聚合成1分钟,5米,30米,1小时,1天,1周,1个月的聚合。对于这些聚合中的每一个,还存储Min,Max,Avg。 构建此多维数据集的速度很慢,目前无法扩展,因为它从单一来源挖掘数据。

我认为每个数据点的RRD样式数据库更适合数据推送。 但是我有几个关于RRD的问题(最受欢迎的例子)

  1. RRD可以保留数据粒度,同时还可以执行累积 时间?
  2. 可以将数据输入RRD以纠正间隙吗?
  3. 感谢。

    欢迎提供例子

1 个答案:

答案 0 :(得分:1)

  1. 是 - 您需要适当配置您的RRA。
  2. RRA是循环档案,用于定义数据点数和分辨率。所以你可以 - 假设5分钟的采样率:

    RRA:AVERAGE:0.5:1:2000
    RRA:AVERAGE:0.5:12:2400
    

    将持有约一周的5米分辨率,以及1小时的100分辨率。但你可以很容易地扩展你的5米分辨率RRA - 尽管它会让你的RRD更大。问题是 - 你真的需要吗? RRD的重点是自动归档与图形分辨率 - 查看一年的统计数据,无论如何都无法呈现5米的分辨率。对于5米样本,1600px宽图仅为6天左右。

    1. 是的,但由于RRD的工作方式,它有点烦人。实际上,您必须提取并重放数据以回填差距。如果您正在重播'这并不一定能很好地发挥作用。你失去决心的事情,因为你没有足够的样本。您可以rrdtool dump以XML格式提取RRD的内容,您也可以直接修改它,然后rrdtool restore。如果您需要以任何实际频率执行此操作,我建议使用除rrdtool之外的其他内容。