PIG如何将行数从1个别名返回到另一个别名

时间:2018-06-01 03:02:01

标签: hadoop apache-pig

{{1}}

我正在尝试将loadhtml_content的行计数返回到另一个别名。我想不出另一个想法。

log = FOREACH count GENERATE myfunc.nLog($ 0,$ 1,(我需要在这里返回loadhtml_content的行数));

1 个答案:

答案 0 :(得分:0)

我相信这是您正在寻找的确切功能:https://issues.apache.org/jira/browse/PIG-1434。 从本质上讲,它使我们可以在需要时将单重关系用作常量。 遵循以下几句话可以解决您的问题:

loadhtml_content = FOREACH loadhtml generate content;
content_rows = FOREACH (GROUP loadhtml_content ALL) GENERATE 
                   COUNT(loadhtml_content);
log = FOREACH count GENERATE myfunc.nLog($0,$1,content_rows.$0);