我的问题是,如果我在hive中有一个类似
的表来源 - 目的地
1 ---------- 2
1 --------- 3
2 --------- 1
3 ---------- 1
2 ---------- 2
1 ---------- 3
现在我需要为每个目的地获取不同的源值,因此输出就像
目标来源
1 -------------- 2 3
2 -------------- 1 2
3 -------------- 1
其中源由ctrl + A('\ 0001')
分隔我尝试了很多东西,但是我得到了解决这个问题的方法。 我们可以有一些可以解决这个问题的蜂巢脚本吗?
谢谢&问候, Sreelatha。
答案 0 :(得分:0)
我认为 collect_set 应该在这里工作。尝试运行此查询:
select destination, collect_set(source) from table GROUP BY destination