使用Cluster by的Hive子查询优化

时间:2018-09-19 18:52:26

标签: sql hive

我要加入两个没有存储分区的表。在子查询中,数据通过连接键聚类。

与没有集群的情况相比,这是否有助于提高查询的性能
select
a.user_key,b.user_key
from 
(select user_key from 
table1 
cluster by user_key) a 
left join 
(select user_key from 
table2 
cluster by user_key) b on a.user_key=b.user_key

0 个答案:

没有答案