我正在比较AWS Athena中CSV和Parquet文件的性能。
为了确保我不会大幅减少同一查询连续两次运行的执行时间,我想确保禁用缓存。
我们知道是否有解决方案吗? 或者,如果AThena默认情况下甚至没有启用缓存。
答案 0 :(得分:0)
Athena如何配置后面的presto引擎完全不受我们的控制。我已经彻底测试了Aws Athena,从我的发现来看,它不会缓存数据。我看到连续执行的相同查询需要花费相同的时间和数据扫描。
但Parquet肯定会为您提供更好的性能和更少的数据扫描,以提高成本效益。