应用错误收集

使用Cluster by的Hive子查询优化

时间：2018-09-19 18:52:26

标签： sql hive

我要加入两个没有存储分区的表。在子查询中，数据通过连接键聚类。

与没有集群的情况相比，这是否有助于提高查询的性能

select
a.user_key,b.user_key
from 
(select user_key from 
table1 
cluster by user_key) a 
left join 
(select user_key from 
table2 
cluster by user_key) b on a.user_key=b.user_key

0 个答案:

没有答案