我目前正在使用AWS Redshift服务来存储数据。数据大小即将达到磁盘空间的100%。
添加节点并从单节点更改为多节点会增加磁盘大小吗?
从dc1.xlarge转移到更大的节点,例如dc1.8xlarge,是增加磁盘空间的唯一方法吗?
如果我转移到多节点,数据会被拆分还是只是镜像,以便两个节点都有相同的数据?
答案 0 :(得分:6)
Redshift是一种分布式柱状数据仓库解决方案。这里的关键是"分发"。与传统数据库不同,Redshift旨在通过向群集添加节点来扩展。添加节点会增加磁盘空间以及计算功能。回答你的问题 -
一般来说,是的。在Redshift中存储数据时,您应该选择一个分布键(列或列集),以便在不同节点之间均匀分布数据。作为一般原则,您应该在所有表中为分配键使用相同的列集。请注意,配置为使用所有分发方式的表将在所有节点之间进行复制;将dist样式限制为仅限维度表。
没有;见上面问题1的答案。根据您的要求,您可以选择不同类型的节点。 DC1是计算优化节点;它们具有更小但更快的SSD驱动器。 DS1节点将为每个节点提供更高的磁盘空间。
请参阅上面的答案 - 当您向Redshift群集添加节点时,Redshift将按照每个表的分配方式中的指定在所有节点上重新分发数据。
PS:我强烈建议您阅读Redshift文档。从Are You a First-Time Amazon Redshift User?
开始