如果您有关系数据库且想要开始制作报告,可以执行以下操作(如果这不正确,请告诉我。)
问题: 我最初将维度视为数据集市,引用了来自外部资源的数据,而事实表又反过来引用维度中的数据......这是不正确的,不是吗?反过来......
或者一般来说,如果你要规范化数据库,你总是会用一个外键替换你拿出一个表的列,并将一个主键添加到新表中?
答案 0 :(得分:3)
事实表表示您要分析的流程或事件。
第1步:您要分析的流程或事件是什么?
事实表中的列表示与分析相关的所有变量。
第2步:哪些变量与分析相关?
是否将“拆分”列拆分为维度表与您的理解无关。这是一种优化,可以最大限度地减少事实表占用的空间。
如果您想区分度量和维度,请询问
第3步:我的事实表中的(真)数值是多少?这些是你的措施。
真实数值的一个示例是美元金额,例如销售订单行项目扩展价格。你可以总结一下或平均一下。
不正确数值的一个示例是客户ID 12345.它是一个数字,但代表的不是数字(客户)。客户ID的总和毫无意义,平均值也没有意义。挖?
关于你的问题:
事实表不需要外键来标注表。 (提示:请参阅热插拔尺寸)
“作为引用外部来源数据的数据集市的维度”。嗯...也许,但现在不要担心数据集市。维度只是事实表中的一列(不是度量)。维度表只是相关维度的集合。
刚开始使用Excel。找出分析中所需的列。把它们放在Excel中。那是你的事实表。如果您希望事实表变大(100 MB),那么进行一级标准化:
找出你的措施。将它们留在事实表中。
找出你的尺寸。将它们组合在一起(将客户信息分成一组,将信息存储到另一组)。
将它们放在自己的表中。给他们毫无意义的代理钥匙。将这些键放在事实表中。