是否应在事实表中使用所有维度值?

时间:2013-05-13 19:13:51

标签: data-warehouse business-intelligence dimensional-modeling

我建模了一个有6个维度的数据仓库。其中一个维度是客户端,它有大约600k行,还有一些其他如帐户和产品。我通过乘以每个维度表的基数来估计事实表的行数,结果给出1 * 10 ^ 12行。我的问题是,如果客户没有某个产品,那么该产品是否会有一行(事实表中有cero值),或者根本不会有一行?我需要这些信息才能知道我的aproximation是否是行数的上限,或者是确切的行数。

1 个答案:

答案 0 :(得分:1)

每个维度组合都不需要输入。

与理论规模(即维度的基数相乘)相比,事实表(或立方体)通常非常小。即使具有相对较小的维度(例如,时间,产品,地理,客户,销售等等),该理论数量的行(或单元)也可以非常大。这被称为立方体的稀疏性; OLAP引擎(例如icCube,SSAS等)通常用于有效处理这种稀疏性。