AWS Redshift - 在卸载到s3时设置零件尺寸

时间:2014-07-24 07:55:33

标签: amazon-web-services amazon-s3 amazon-redshift

在将大型结果集卸载到s3时,redshift会自动将文件拆分为多个部分。有没有办法在卸载时设置每个零件的尺寸?

2 个答案:

答案 0 :(得分:0)

卸载时,可以使用maxfilesize指示文件的最大大小。 例如:

    unload ('select * from venue')
to 's3://mybucket/unload/' 
iam_role 'arn:aws:iam::0123456789012:role/MyRedshiftRole'
maxfilesize 1 gb;

From here

答案 1 :(得分:-2)

默认情况下,Redshift根据群集中的切片数将数据卸载到多个文件中。因此,如果群集中有4个切片,则每个群集将同时写入4个文件。

以下是文档中对您的问题的简短回答。有关详细信息,请转到here

"默认情况下,UNLOAD根据群集中的切片数量将数据并行写入多个文件。默认选项为ON或TRUE。如果PARALLEL为OFF或FALSE,则UNLOAD按顺序写入一个或多个数据文件,根据ORDER BY子句绝对排序(如果使用)。数据文件的最大大小为6.2 GB。因此,例如,如果您卸载13.4 GB的数据,UNLOAD会创建以下三个文件。"

我希望这会有所帮助。