如何固定配置单元代码来计数一列并按另一列分组?

时间:2019-05-17 01:05:10

标签: hadoop hive group-by

我的配置单元数据(user, gender, rating中有3列。现在,我想计算user_id, gender明智的数量。我已将蜂巢代码编写为

select user_id, gender, count(*) from u_user group by user_id;

但是我遇到的错误是

  

SemanticException [错误10025]:行1:16表达式不在GROUP BY中   关键的“性别”

该如何解决?

1 个答案:

答案 0 :(得分:0)

好吧,您group by的键应与select中的键相同。如下:

select user_id,gender,count(1) from u_user group by user_id,gender;

如果要计算每种性别类型的user_id,则可以这样写:

select gender,count(distinct user_id) from u_user group by gender;