标签: hadoop hive
Select a.drr1,b.drr1 from a left join b on a.drr1=b.drr1
表a中的重复drr1个值,而表b具有唯一的drr1值。这是一个多对一的蜂巢加入。
a
drr1
b
由于表a非常大且重复值很多,因此需要很长时间。 关于如何在蜂巢中解决这个问题的任何指示。
答案 0 :(得分:0)
执行类似
SELECT DISTINCT * FROM A LEFT JOIN B ON A.drr1=B.drr1;