在PIG中,每次左外连接超过2个关系

时间:2015-08-24 15:34:59

标签: hadoop apache-pig

我正在尝试在猪的单个语句中执行左外连接以获得更多的2个关系。可能吗?

此致 哈里什

1 个答案:

答案 0 :(得分:3)

不幸的是,一步中的多向连接仅适用于内连接。取自the official documentation

  

<强> 用法

     

...

     

外连接仅适用于双向连接;要执行多向外连接,您需要执行多个双向外连接语句。

所以,直到他们增加了这种可能性,这种可能性很快就会消失(没有开放的JIRA正在研究它),你需要在2个语句中做到这一点:

A = LOAD 'a' AS (a:chararray,b:int);
B = LOAD 'b' AS (a:chararray,b:chararray);
C = LOAD 'c' AS (a:chararray,b:chararray);
D = JOIN A by $0 LEFT OUTER, B BY $0;
E = JOIN D by $0 LEFT OUTER; C BY $0;