对AWS较新,并首次与Athena合作。不胜感激。
我将查询结果位置设置为s3:// aws-athena-query-results- {ACCOUNTID}-{Region},可以看到无论何时运行查询,无论是从控制台还是从外部进行查询,则两个结果文件均按预期创建。
但是,我的问题是长期处理这些文件应该做什么?关于轮换他们有什么建议?据我了解,这些是查询结果(另一个是元数据文件),其中包含用户查询的结果并将其传递回给他们。关于如何管理查询结果存储桶文件有哪些建议?我不想只让他们在那里积累,如果有道理就恢复到一百万个文件。
我确实搜索了文档,但找不到上述主题的信息,也许我错过了?不胜感激!
谢谢!
答案 0 :(得分:0)
您可以删除元数据文件(* .csv.metadata),而不会引起错误, 但是有关查询的重要信息丢失了
如果您不想引用过去在特定日期运行的查询以及返回的结果,则可以安全地删除查询结果文件。如果您已从S3存储桶中删除了结果文件,并从雅典娜“历史”中删除了尝试下载结果的文件,则只会显示错误消息,提示结果文件不可用。
总而言之,取决于您的用例,是否需要承担将来运行相同查询的费用?或只想从过去的运行历史记录中提取结果。