AWS Redshift添加节点并将其从单节点更改为多节点以增加磁盘大小

时间:2020-08-11 12:07:33

标签: amazon-web-services amazon-redshift

由于我是Redshift的新手,所以我有以下问题。

添加新节点以增加磁盘空间时,我需要使用“分布样式” 选择吗?

由于我的目的是增加磁盘空间,我是否需要考虑“分布样式”或已经编写的查询中的任何更改(查询在单个节点中有效,没有任何问题)?

1 个答案:

答案 0 :(得分:0)

随着越来越多的节点存在,分布变得很重要。

每个节点至少有2个分片,具体取决于执行这些查询时数据在这些分片上的分布方式。

您可以通过以下方式分发:

  • EVEN-数据集在片之间平均分配,而如果必须从其他片对该数据执行联接,则这将在所有节点之间平均分配存储。没有连接的非规范化数据将极大地受益,因为它将获得每个节点上的CPU来执行计算。
  • KEYS-数据集根据它们与其他数据的关系分配给切片,这在使用表中的联接时确实会受益,但请注意,数据可能会不均匀地分布在切片上。
  • ALL-每个分片都将获取整个数据集,对于小型数据集(小于10GB的表)或数据很少更改的数据集,请使用此选项。
  • AUTO-Redshift会关注分发样式并尝试为数据集选择正确的内容,您无法控制其所做的决策。

在做出决定之前,您应该考虑如何使用数据,因为它会影响您获得的存储和性能输出。