由于我是Redshift的新手,所以我有以下问题。
添加新节点以增加磁盘空间时,我需要使用“分布样式” 选择吗?
由于我的目的是增加磁盘空间,我是否需要考虑“分布样式”或已经编写的查询中的任何更改(查询在单个节点中有效,没有任何问题)?
答案 0 :(得分:0)
随着越来越多的节点存在,分布变得很重要。
每个节点至少有2个分片,具体取决于执行这些查询时数据在这些分片上的分布方式。
您可以通过以下方式分发:
EVEN
-数据集在片之间平均分配,而如果必须从其他片对该数据执行联接,则这将在所有节点之间平均分配存储。没有连接的非规范化数据将极大地受益,因为它将获得每个节点上的CPU来执行计算。KEYS
-数据集根据它们与其他数据的关系分配给切片,这在使用表中的联接时确实会受益,但请注意,数据可能会不均匀地分布在切片上。ALL
-每个分片都将获取整个数据集,对于小型数据集(小于10GB的表)或数据很少更改的数据集,请使用此选项。AUTO
-Redshift会关注分发样式并尝试为数据集选择正确的内容,您无法控制其所做的决策。在做出决定之前,您应该考虑如何使用数据,因为它会影响您获得的存储和性能输出。