从hive中的非嵌套数据创建嵌套数据

时间:2016-07-08 15:52:50

标签: hadoop hive hiveql parquet

我是否可以通过非嵌套数据

在hive中创建嵌套数据

实施例: 源表

id zip_code
123 12345
123 23456
123 56789
234 12345
234 99999

看起来像这样

id zipcode
123 12345,23456,56789
234 12345,99999

请注意,id的邮政编码数量可能会有所不同

1 个答案:

答案 0 :(得分:1)

select id
     , concat_ws(',',collect_set(zip_code)) as zipcode 
  from your_table 
 group by id

collect_set()将删除zip_code集合中的重复项。如果您需要重复项,请改用collect_list