在hadoop中加入文件A,B,C

时间:2012-12-19 09:38:43

标签: join hadoop apache-pig

  

可能重复:
  Pig Script: Join with multiple files

我做了一个基于hadoop的程序。 现在,我有三个文件A,B,C。我想加入他们并遵循条件“A.one = B.one和A.two = C.one”;然后将结果存储到文件D中。

我对猪有一点了解,但是它的加入不能满足这个命令。

1 个答案:

答案 0 :(得分:2)

实际上猪很容易加入两步:

A=LOAD ..
B=LOAD ..
C=LOAD ..

AB= JOIN A BY A.one,B BY B.One;
D= JOIN AB BY A::two, C BY C.one;