Redshift Composite Sortkey - 我们应该使用多少列?

时间:2017-08-27 14:49:31

标签: amazon-redshift

我正在Amazon Redshift上构建几个非常大的数据表,这些表应该包含几个经常查询的属性以及相关指标的数据。

我们使用均匀分布样式(“diststyle even”)让所有节点都参与查询计算,但我不确定sortkey的长度。

它绝对应该是复合的 - 每个查询都会在日期和网络上使用第一个过滤器 - 但在该级别之后,我还有大约7个可以查询的其他相关因素。 我见过的所有例子都使用2-3个字段的复合排序键,最多4个。

我的问题是 - 为什么不使用包含表格中所有关键字段的排序键?拥有长排序键的缺点是什么?

1 个答案:

答案 0 :(得分:0)

如果您有多个排序键,VACUUM也会花费更长的时间。