我有一个快速回答OLAP多维数据集或数据立方体的问题。 当我看到image时我并不理解"其中"多维数据集上表示的数据是。我想这个表面上是对的,对吗?否则旋转立方体将不会显示完全不同的值。
所以,我的问题是,在多维数据集中存储了什么数据""
不应该是这样的:
f(x,y,z) -> value (1)
并且值在单元格内?但在这里我只看到
f(x,y) -> surfacevalue (2a)
f(x,z) -> surface value (2b)
f(y,z) -> surface value (2c)
那么,实际存储在多维数据集中的是什么?所有映射(1 - 2c)。
答案 0 :(得分:0)
不幸的是,有很多令人困惑的术语连接到OLAP数据库。多维数据集是最严重的违规者之一,因为它适用于所有数据库,无论维度数量多少。尽管你可以合理地假设一个立方体指的是一个三维物体。
在这种情况下,立方体被用作比喻,不应该被视为字面意思。使用它是因为很难说明/想象超过3维的物体。
一维数据集可以表示如下:
10.00 15.00 16.00
--------------------------------
Year 2014 2015 2017
在这里,我们可以看到针对年份绘制的度量。
二维可以这样说明:
Region 1 | 5.00 2.00 4.00
2 | 5.00 5.50 5.00
3 | 0.00 7.50 5.00
----------|--------------------------
Year | 2014 2015 2017
现在我们可以看到针对年份和地区绘制的相同度量。
三维可以被认为是一个立方体。 Wikipedia picture you linked to就是一个很好的例子。
现在我们得到了更高的尺寸,例如在2d屏幕上难以/不可能生成示例。实际上,4/5/6 / etc维度报告通常以二维报告的形式呈现,并应用了一系列过滤器,限制了返回的记录和总数。
示例:
Department: Marketing
Customer Age: 18 - 24
Region 1 | 1.15 1.50 0.00
2 | 2.75 4.01 1.25
3 | 0.00 0.00 1.14
----------|--------------------------
Year | 2014 2015 2017
这显示我们的测量有2个额外的过滤器。现在是4d报告。
多维数据集概念试图表达数据层,您可以浏览它们。
蒙纳士大学的Rob Meredith博士在他podcasts的一篇论文中讨论了这个主题。我认为它只有Semester 1, 2009 - Episode 3
或Semester 1, 2009 - Episode 4
的一半。