Datahousehouse中的低基数维度

时间:2014-11-26 05:06:20

标签: data-warehouse dimensional-modeling

我的事实表中有很多列具有非常低的基数(~8)。这些列中的每一列都存储引用主表的键。我想知道是将这些单独的主表作为维度导入还是将值直接存储在事实表中。除了我想要存储的值之外,主表没有其他属性。每种方法的优缺点是什么?

1 个答案:

答案 0 :(得分:2)

这似乎是垃圾维度的典型示例,它结合了许多杂项,低基数的标记和指标(而不是将它们中的每一个放在一个单独的维度表中)。 / p>

其他方法的缺点:

  • 将每个低基数属性放在单独的专用维中可能会导致模型过于复杂,维度表数量过多(centipede fact tables)。
  • 允许将属性直接存储在事实表中但仅保留给degenerate dimensions,即订单或发票号,零售销售点交易号等值 - 高基数没有任何描述它们的附加属性的值 低基数标志不是DD,因为即使它们现在可能由唯一的密钥组成,它们将来很容易具有其他属性,例如报告的多个描述性标题 - 移动用户的简称和桌面用户的简称。

详细信息:Design Tip #113 Creating, Using, and Maintaining Junk Dimensions