我正在Amazon Redshift上构建几个非常大的数据表,这些表应该包含几个经常查询的属性以及相关指标的数据。
我们使用均匀分布样式(“diststyle even”)让所有节点都参与查询计算,但我不确定sortkey的长度。
它绝对应该是复合的 - 每个查询都会在日期和网络上使用第一个过滤器 - 但在该级别之后,我还有大约7个可以查询的其他相关因素。 我见过的所有例子都使用2-3个字段的复合排序键,最多4个。
我的问题是 - 为什么不使用包含表格中所有关键字段的排序键?拥有长排序键的缺点是什么?
答案 0 :(得分:0)
如果您有多个排序键,VACUUM也会花费更长的时间。