如果我们可以将特定的关系字段加载到另一个字段中,请告诉我,如下所示
usergroup = GROUP input BY user;
output = FOREACH usergroup {
intermediate = input.traid;
distinctdata = DISTINCT intermediate;
GENERATE group as user,count(distinctdata); };
答案 0 :(得分:1)
您无法将特定的关系字段加载到另一个字段中。
根据我的理解,您希望为input.traid
添加不同的值,然后计算它。
对于每个用户,1
始终会获得count(distinctdata)
。为什么要将此作为输出?
DISTINCT
不适用于特定列(字段),但用于元组(行)。
删除重复的元组。