数据仓库设计中星型模式的一个衡量标准是什么?

时间:2011-09-30 21:47:08

标签: data-mining data-warehouse star-schema

星型模式由维度和事实表组成。

事实表包含每个维度的外键,除此之外,它还包含“度量”。究竟是什么构成了这一措施?

是否存储了一些聚合函数的答案?

4 个答案:

答案 0 :(得分:1)

基本上是的。

如果你有一个简单的网格

Salary     Januari   Februari   March   April   May    June
           Q1                         Q2

Me         1100      1100      1100    1100    1500    1500
Collegue1   2000      2000      2000    0       0      0

时间是具有两个级别的分层维度(显示)。 显示的另一个维度是“EmployeeID”。另一个维度(未显示)可以在PointOfView中(例如预算/实际)。

金额(例如1100)是衡量标准,它构成了您的事实(事实的非标识部分)。维度定义了各个级别上每个度量的合并函数(例如,金额(Q1)== SUM(金额(1月... 3月)))。请注意,合并的行为会有所不同,具体取决于衡量标准(例如,所得税税率不会相加,但会以某种方式合并:OLAP Cube设计的艺术究竟如何)。

(琐事:你可以有计算的测量,使用MDX来查询例如与上一季度相比的金额偏差,整个季度的平均工资水平等等;很明显,再次,合并公式需要思考)。

此时您将开始看到设计合并规则取决于规则的计算顺序(如果“薪资偏差%”的公式是先评估然后合并,则需要对其进行平均;但是,如果原始SALARY指标首先合并(汇总)到Q1,Q2水平,则可以计算得出的指标,就像它处于最低水平一样。

现在,在决定如何存储多维数据集时,事情变得更加有趣。基本上存在两种方式:

  • 预先计算所有单元格(包括所有方案中的所有合并)
  • 即时计算

大多数OLAP引擎都融合在混合方法(HOLAP)上,任何人都不会感到惊讶,在这些方法中,经常访问的合并级别的重要部分是预先计算和存储的,其他部分是动态计算的。

有些人会将基础数据存储在标准RDBMS(ROLAP)中,而其他人则不会(OLAP)。专注于高性能的引擎倾向于将所有数据保存在预先计算的多维数据集中(对于非常稀疏的维度,仅使用“许多小子多维数据集”)。

嗯,不管怎么说,这有点像咆哮。我喜欢漫游我在做数据仓库和OLAP时学到的东西

答案 1 :(得分:0)

事实和衡量标准是afaik的同义词。事实是数据:销售,生产,交付等。维度是与事实(时间,地点,部门)相关的信息。

答案 2 :(得分:0)

措施是两种事情之一。

  1. 措施。测量。带单位的数字。美元,重量,体积,尺寸等。测量。

  2. 骨料。数据的总和(或有时是平均值)。它可能是仓库中的数据:出于性能原因预先计算的聚合。或者它可能是无法获取(或不需要)的数据,因为它太详细了。体积太大或什么的。

  3. 关于事实表的最重要的事情是非关键度量是单位的实际测量。

答案 3 :(得分:0)

如果它是相邻的树模型,它将是标题字段或包含数据的任何其他字段。