OLAP多维数据集 - 数据立方体

时间:2017-07-26 09:05:17

标签: database data-warehouse olap

我有一个快速回答OLAP多维数据集或数据立方体的问题。 当我看到image时我并不理解"其中"多维数据集上表示的数据是。我想这个表面上是对的,对吗?否则旋转立方体将不会显示完全不同的值。

所以,我的问题是,在多维数据集中存储了什么数据""

不应该是这样的:

f(x,y,z) -> value (1)

并且值在单元格内?但在这里我只看到

f(x,y) -> surfacevalue (2a)

f(x,z) -> surface value (2b)

f(y,z) -> surface value (2c)

那么,实际存储在多维数据集中的是什么?所有映射(1 - 2c)。

1 个答案:

答案 0 :(得分:0)

不幸的是,有很多令人困惑的术语连接到OLAP数据库。多维数据集是最严重的违规者之一,因为它适用于所有数据库,无论维度数量多少。尽管你可以合理地假设一个立方体指的是一个三维物体。

在这种情况下,立方体被用作比喻,不应该被视为字面意思。使用它是因为很难说明/想象超过3维的物体。

一维数据集可以表示如下:

        10.00   15.00   16.00
--------------------------------
Year    2014    2015    2017

在这里,我们可以看到针对年份绘制的度量。

二维可以这样说明:

Region  1 |   5.00    2.00    4.00
        2 |   5.00    5.50    5.00
        3 |   0.00    7.50    5.00
----------|--------------------------
Year      |   2014    2015    2017

现在我们可以看到针对年份和地区绘制的相同度量。

三维可以被认为是一个立方体。 Wikipedia picture you linked to就是一个很好的例子。

现在我们得到了更高的尺寸,例如在2d屏幕上难以/不可能生成示例。实际上,4/5/6 / etc维度报告通常以二维报告的形式呈现,并应用了一系列过滤器,限制了返回的记录和总数。

示例:

Department:   Marketing
Customer Age: 18 - 24

Region  1 |   1.15    1.50    0.00
        2 |   2.75    4.01    1.25
        3 |   0.00    0.00    1.14
----------|--------------------------
Year      |   2014    2015    2017

这显示我们的测量有2个额外的过滤器。现在是4d报告。

多维数据集概念试图表达数据层,您可以浏览它们。

蒙纳士大学的Rob Meredith博士在他podcasts的一篇论文中讨论了这个主题。我认为它只有Semester 1, 2009 - Episode 3Semester 1, 2009 - Episode 4的一半。