如何在S3中处理历史和当前数据?

时间:2019-11-07 00:51:45

标签: amazon-s3 amazon-athena

我有一个ETL流程,数据来自json,由nifi在avro中提取。每周执行一次Athena查询,以将这些数据合并为历史记录,以查看所有数据的视图,并在两个表之间进行合并。 看起来不错,首先运行。

第二周要添加到创建的实木复合地板文件中,我同时使用CTAS查询两个位置,并生成一个新的历史实木复合地板来替换以前的实木复合地板。

问题是如何处理?这种方式似乎是错误的。我不想扫描成千上万个文件,但是都不想重新创建所有文件。也许雅典娜会插入新分区?

0 个答案:

没有答案