使用分区查询Amazon Athena

时间:2017-06-30 10:15:53

标签: amazon-web-services partitioning amazon-athena

假设我想通过某些属性和每个属性来分区 分区我有几个带有JSON记录的文件(每个文件都有更多记录)。

我想通过一些属性查询它们,该属性指定何时为特定属性创建记录(给我在某个日期之前创建的所有记录)。

我是否需要按日期对文件进行排序以获得更好的性能?

雅典娜是否只是从第一张唱片扫描到最后一张唱片而不是 给我结果?

1 个答案:

答案 0 :(得分:2)

Athena分区完全基于S3文件夹结构。除此之外,所有查询都从第一个元素运行到最后一个元素。

如果您需要某种分区,您只能通过S3目录定义它们,然后管理它们(手动或自动,具体取决于文件夹格式)

这里有一些关于分区的更多信息:

Partitioning Data