COLUMN STORE INDEX与CLUSTERED INDEX ..哪一个使用?

时间:2014-09-10 19:50:39

标签: sql indexing olap-cube sql-server-2014

我正在尝试评估在SQL Server 2014数据集市中的表上使用哪种类型的索引,我们用它来为SSAS中的OLAP多维数据集提供支持。我已经阅读了MSDN上的文档,但仍然有点不清楚哪个是我们用例的正确策略,其最终目标是在人们浏览多维数据集时加速多维数据集发出的SQL Server查询。

我有相互关联的表格,如下面的雪花片尺寸模型所示。我们将在多维数据集中进行的大部分计算是基于维度(过滤器和枢轴)的不同组合的用户(UserInfoKey)的COUNT DISTINCT。牢记这一点,SQL专家建议我在表上创建索引方面做些什么?我可以选择在我的所有表上创建COLUMN STORE INDEXES(由主键的HASH分区)或在我的所有表上创建常规主键(聚簇索引)。哪一个对我的情况更好?根据我的理解,立方体将根据用户选择的尺寸进行大量连接和groupby。

enter image description here

我尝试了两个版本的一些样本数据,两种情况下的表现并没有那么不同。现在,在我对真实数据进行相同的实验之前(生成真实数据并将其加载到我们的数据集市需要花费大量时间),我想与专家核实他们的建议。

我们还在评估是否应该使用PDW(Parallel Datawarehouse)作为我们的数据集市而不是vanilla SQL Server 2014.

只是想知道我们正在处理的数据规模

最大的两个表是

  1. ActivityData事实表:78400多万行
  2. DimUserInfo维度表:30 +百万行
  3. 任何帮助或指示表示赞赏

0 个答案:

没有答案