我在一家从智能电表接收数据的公司工作。对于直播流,该数据可以长达2天,并且可以在出现错误(间隙等)的情况下填充后期。目前我们通常存储5年。然后将数据拉入SSAS立方体并聚合成1分钟,5米,30米,1小时,1天,1周,1个月的聚合。对于这些聚合中的每一个,还存储Min,Max,Avg。 构建此多维数据集的速度很慢,目前无法扩展,因为它从单一来源挖掘数据。
我认为每个数据点的RRD样式数据库更适合数据推送。 但是我有几个关于RRD的问题(最受欢迎的例子)
感谢。
欢迎提供例子
答案 0 :(得分:1)
RRA是循环档案,用于定义数据点数和分辨率。所以你可以 - 假设5分钟的采样率:
RRA:AVERAGE:0.5:1:2000
RRA:AVERAGE:0.5:12:2400
将持有约一周的5米分辨率,以及1小时的100分辨率。但你可以很容易地扩展你的5米分辨率RRA - 尽管它会让你的RRD更大。问题是 - 你真的需要吗? RRD的重点是自动归档与图形分辨率 - 查看一年的统计数据,无论如何都无法呈现5米的分辨率。对于5米样本,1600px宽图仅为6天左右。
rrdtool dump
以XML格式提取RRD的内容,您也可以直接修改它,然后rrdtool restore
。如果您需要以任何实际频率执行此操作,我建议使用除rrdtool之外的其他内容。