配置单元如何根据条件合并组中的多个记录

时间:2019-04-05 12:24:58

标签: hive hiveql hadoop2

我有如下数据集。

client-Id   Name    HasCar     HasHome
A01          ABC      Y          N
A01          ABC      N          N
B01          EFG      N          N
B01          EFG      N          Y

从这里,我需要为每个客户(无论有车还是有房子)派出一个单行。预期的输出应如下所示

Client-Id    Name    HasCar     HasHome
A01          ABC      Y          N
B01          EFG      N          Y

这需要使用Hive-QL完成

1 个答案:

答案 0 :(得分:0)

使用max()聚合:

select client-Id,Name, max(HasCar) HasCar,  max(HasHome) HasHome
  from your_table 
 group by client-Id,Name