标签: join hadoop apache-pig
可能重复: Pig Script: Join with multiple files
我做了一个基于hadoop的程序。 现在,我有三个文件A,B,C。我想加入他们并遵循条件“A.one = B.one和A.two = C.one”;然后将结果存储到文件D中。
我对猪有一点了解,但是它的加入不能满足这个命令。
答案 0 :(得分:2)
实际上猪很容易加入两步:
A=LOAD .. B=LOAD .. C=LOAD .. AB= JOIN A BY A.one,B BY B.One; D= JOIN AB BY A::two, C BY C.one;