在猪如何找出两个数据集或关系之间的联合?

时间:2015-06-11 12:23:56

标签: apache-pig

我有一个文本文件,我使用一些规则进行处理,并提出两个单独的关系

dump A;

A=

({(18),(17),(16),(15)})

({(4),(1)})

({(7),(6)})

({(9),(2)})

({(13),(11)})

dump B;

B = 

({(4),(3)})

我希望根据它所持有的值加入这些值,即A的(4),(1)和B的(4),(3)应加入,并且它们的联合应显示为输出(4),(1),(3)

输出应该是这样的 -

({(18),(17),(16),(15)})

({(4),(1) ,(3)})

({(7),(6)})

({(9),(2)})

({(13),(11)})

提前致谢

1 个答案:

答案 0 :(得分:0)

datafu中有一个包加入:http://datafu.incubator.apache.org/docs/datafu/guide/bag-operations.html 加入后,您可以申请DISTINCT