redshift做真空合并时的磁盘使用情况?

时间:2015-03-17 03:07:22

标签: amazon-web-services amazon-redshift

我知道redshift将真空进程分为两个阶段:排序和合并。

在排序过程中,磁盘使用率不会改变,但合并阶段似乎会占用大量的可用空间。

我的群集是dw2.xlarge的3个节点,总共480 GB SSD。在吸尘之前,磁盘总使用率约为50%。

我在一个81GB的表上做了一个真空,但由于磁盘已满错误,它在尝试合并时失败了。

我想知道我应该预留多少空间用于抽真空的大型未分类表格?

我问这个问题是为了红移支持团队,但直到现在还没有得到任何答复。有没有人有这方面的经验?

1 个答案:

答案 0 :(得分:1)

是的,可以使用更长时间的真空deep copy

这样可以避免磁盘使用问题。

当您在此处插入(select * from ...)时,选择您选择数据的排序顺序,以便您按照排序方式插入数据。

根据您的排序键执行增量插入(select * from) 例如,如果您要存储30天的数据,那么每天都要进行深层复制 这应该避免空间问题