蜂巢中的聚合和分组

时间:2014-11-12 05:45:42

标签: hadoop hive hiveql

我的表结构:

Date      Year    Month    Code    Name

如果我能得到如下结果,那就太好了。

Year  Month  Code   CodeCount  Name  NameCount

结构是这样的,'Code'可以有多个'Name',但'Name'总是有一个'Code'

如果这不可能,我可以将其分解为两个查询

Year  Month  Code   CodeCount

Year  Month  Name  NameCount

我只是盯着蜂巢,真诚地感谢任何帮助。

由于

1 个答案:

答案 0 :(得分:0)

select Year,Month,Code,Name,count(*) as NameCount from table group by Year,Month,Code,Name;

有了这个,我应该可以Select Code, Sum(NameCount)来获取CodeCount