如何汇总/汇总百分位度量

时间:2013-03-01 16:16:51

标签: aggregate-functions mdx aggregation mondrian

有一个数据集包含聚合数据 - 汇总到各个维度,并且一直到每小时一级。主要衡量标准是速度,即文件大小除以持续时间。

要求是查看百分位数,中位数和平均值/平均值摘要。

平均值很简单,因为我们只是在MDX中创建一个计算度量,然后它适用于所有聚合级别,即每日/每月等。

然而百分位和中位数很难。有没有什么方法可以计算这些将正确卷起的函数?当我们读取原始数据时,我们可以将百分位速度添加为ETL中的一列,但是我们仍然需要找到一种方法然后进一步推广它?

汇总这些措施的正确方法是什么?询问百分位数并不罕见,所以当我四处看看时,我很惊讶没有看到太多关于此的信息。

也许唯一的方法是在正确的级别上进行各种聚合表,并进行正确的计算,然后让mondrian将它们用作聚合表?或者更糟的情况是有多个立方体(!)

1 个答案:

答案 0 :(得分:1)

好的,所以事实证明你不能卷起百分位数(因此只有50%的中位数)我理解别人有这个问题,请看这封来自Kasper的推文:https://twitter.com/kaspersor/status/308189242788560896

所以我们的解决方案是存储相关统计数据的几个不同的agg表,以及用于存储预先计算的百分位数和中位数统计数据的主要(已经聚合的)事实表。