我知道redshift将真空进程分为两个阶段:排序和合并。
在排序过程中,磁盘使用率不会改变,但合并阶段似乎会占用大量的可用空间。
我的群集是dw2.xlarge的3个节点,总共480 GB SSD。在吸尘之前,磁盘总使用率约为50%。
我在一个81GB的表上做了一个真空,但由于磁盘已满错误,它在尝试合并时失败了。
我想知道我应该预留多少空间用于抽真空的大型未分类表格?
我问这个问题是为了红移支持团队,但直到现在还没有得到任何答复。有没有人有这方面的经验?
答案 0 :(得分:1)
是的,可以使用更长时间的真空deep copy
这样可以避免磁盘使用问题。
当您在此处插入(select * from ...)时,选择您选择数据的排序顺序,以便您按照排序方式插入数据。
根据您的排序键执行增量插入(select * from) 例如,如果您要存储30天的数据,那么每天都要进行深层复制 这应该避免空间问题