如何将数据传递给猪关系

时间:2014-06-08 16:06:02

标签: hadoop

如果我们可以将特定的关系字段加载到另一个字段中,请告诉我,如下所示

usergroup = GROUP input BY user;

output = FOREACH usergroup {
                intermediate = input.traid;
                distinctdata = DISTINCT intermediate;

        GENERATE group as user,count(distinctdata); };

1 个答案:

答案 0 :(得分:1)

您无法将特定的关系字段加载到另一个字段中。

根据我的理解,您希望为input.traid添加不同的值,然后计算它。

对于每个用户,1始终会获得count(distinctdata)。为什么要将此作为输出?

DISTINCT不适用于特定列(字段),但用于元组(行)。

删除重复的元组。