RedShift有一个名为sortkey
的工具,您可以指定一个列。这将确保数据保持此排序顺序。
这与聚集索引有何不同?这也是一样的。
答案 0 :(得分:1)
Amazon Redshift不支持索引。因此,将其称为索引会产生误导。
相反,数据按请求的顺序物理存储。这样做的好处是可以启用区域映射,它可以识别存储在给定块中的数据范围。例如,如果数据按日期排序,则每个区域映射将标识存储在该区域中的最早和最晚日期。这有助于Redshift忽略不包含相关数据的块。
SORTKEY还可以包含多个列甚至interleaved sorts - 一种在保持效率的同时组合两个不同排序顺序的方法。