Redshift副本导致无序行

时间:2016-08-31 05:47:42

标签: amazon-redshift

根据Amazon

  

按排序键顺序加载数据,以避免需要真空。

     

只要每批新数据都跟随您的现有行   表,您的数据将按排序顺序正确存储,您将   不需要冒真空。您不需要预先分配每行中的行   加载,因为COPY会在加载时对每批传入数据进行排序。

排序键是一个时间戳,数据在加载时加载。一次加载200行。然而,行是99%未分类。为什么这么多行未分类?

1 个答案:

答案 0 :(得分:0)

您应该仔细检查您插入的数据,就好像您的新数据按SORTKEY 排序,它打算放在表的末尾,然后才会需要VACUUM 。如果在要加载的有意数据之后至少有一行放置,则此数据将被放入Redshift中的未排序区域,这会导致数据未排序。

有关详细信息,请参阅this example 另请阅读VACUUM进程。