如何在AWS Athena中创建范围分区?

时间:2018-01-18 07:07:03

标签: amazon-web-services partitioning amazon-athena

假设AWS Athena中有一个包含列'Id'的外部表,该列是一个整数以及许多其他列。

有没有办法按“范围”在“Id”列上对此表进行分区?

例如,按以下方式创建分区:

0 >= Id < 10
10 >= Id < 20
20 >= Id < 30
30 >= Id < 40

依旧......

当Id的一个值的数据量不够大时,这可能很有用。然后,我们可以将数据对应于一个存储区中的范围,并减少分区开销。

1 个答案:

答案 0 :(得分:0)

是的,但是您不能将其用作普通分区。分区通常用于减少每个查询读取的数据量,从而提高查询性能。这就是为什么大多数时候人们选择dt = 2019-11-05之类的分区键的原因。您的实际目标是什么?您可以使用存储桶来实现相同的目的。并根据需要创建尽可能多的范围。