我使用AWS Athena分析了logdata。
我的分析表有941009672行。
雅典娜是如此之快。像这个查询一样,查询的运行时间只有3秒。
select count(*) from table
但是,如果请求查询具有大的结果集,则athena无法响应。
select * from table //can not response
在Hadoop中,上述查询花了4分钟。
如何解决此问题?
答案 0 :(得分:0)
还有另一种选择。您可以将S3的路径与查询一起传递。然后,您可以在S3中看到结果,而无需等待响应。运行查询后,您应该在S3中找到该文件。