星图中的尺寸和事实表如何相关?

时间:2014-09-02 20:20:26

标签: data-warehouse

如果您有关系数据库且想要开始制作报告,可以执行以下操作(如果这不正确,请告诉我。)

  1. 浏览您的关系数据库,并列出要包含在报告中的所有列。
  2. 将相关列组合在一起,然后将这些列(标准化)拆分为其他表。这些是尺寸。
  3. 维度然后有一个主键(可能是两行的组合),事实表有一个外键来引用每个维度,加上你不会在第一个地方分开的字段,如销售值。
  4. 问题: 我最初将维度视为数据集市,引用了来自外部资源的数据,而事实表又反过来引用维度中的数据......这是不正确的,不是吗?反过来......

    或者一般来说,如果你要规范化数据库,你总是会用一个外键替换你拿出一个表的列,并将一个主键添加到新表中?

1 个答案:

答案 0 :(得分:3)

事实表表示您要分析的流程或事件。

第1步:您要分析的流程或事件是什么?

事实表中的列表示与分析相关的所有变量。

第2步:哪些变量与分析相关?

是否将“拆分”列拆分为维度表与您的理解无关。这是一种优化,可以最大限度地减少事实表占用的空间。

如果您想区分度量和维度,请询问

第3步:我的事实表中的(真)数值是多少?这些是你的措施。

真实数值的一个示例是美元金额,例如销售订单行项目扩展价格。你可以总结一下或平均一下。

不正确数值的一个示例是客户ID 12345.它是一个数字,但代表的不是数字(客户)。客户ID的总和毫无意义,平均值也没有意义。挖?

关于你的问题:

  1. 事实表不需要外键来标注表。 (提示:请参阅热插拔尺寸)

  2. “作为引用外部来源数据的数据集市的维度”。嗯...也许,但现在不要担心数据集市。维度只是事实表中的一列(不是度量)。维度表只是相关维度的集合。

  3. 刚开始使用Excel。找出分析中所需的列。把它们放在Excel中。那是你的事实表。如果您希望事实表变大(100 MB),那么进行一级标准化:

  4. 找出你的措施。将它们留在事实表中。

    找出你的尺寸。将它们组合在一起(将客户信息分成一组,将信息存储到另一组)。

    将它们放在自己的表中。给他们毫无意义的代理钥匙。将这些键放在事实表中。