Pig Script:join和GENERATE后的空值

时间:2014-01-31 03:28:29

标签: hadoop left-join apache-pig

我的猪脚本有一个奇怪的困境。我正在加入多个表,其中一个最后的连接如下:

a = JOIN O_1 by ((long)OpropID, (long)OAID) LEFT, property by ((long)GPropID, (long)prop_AID);

如果我按特定数据点过滤结果,我会从property表(连接中的右表)中获取这些字段的正确结果。即使没有过滤器,结果集也是正确的,我只是过滤它来测试结果。

b = filter a by OpropID==12 and OAID==10;
dump b;

但是,如果在加入后立即创建后续GENERATE语句,则相同的字段(下例中的最后两个)将返回NULL个结果:

c = FOREACH a GENERATE gID, p_AID, OpropID, OAID, GPropID, prop_AID;

我尝试使用$16$17代替字段名称;我还使用property::GPropIDproperty::prop_AID无效。

在这一点上的任何帮助将不胜感激。

0 个答案:

没有答案