Hive:如何使用GROUP BY执行JOIN操作

时间:2015-01-09 21:14:08

标签: sql hadoop hive

我有两张桌子

A -- > id , name
B -- > id , value 

在B表中,我有多个重复的ID,我想找到特定id和打印ID的平均值,名称,AVG(值)

以下是我在表B中查找平均值的查询

SELECT id, AVG(value) FROM B GROUP BY id; 

我需要执行JOIN操作,如何使用GROUP BY执行JOIN操作。

1 个答案:

答案 0 :(得分:1)

这是您想要的:您希望按idname分组

SELECT a.id, a.name, avg(b.value)
FROM A
     JOIN B ON A.id = B.id
GROUP BY A.id, A.name