过滤Pig中的分组值

时间:2013-06-25 15:36:46

标签: hadoop apache-pig

我有一个被分组的关系。如何像地图一样访问分组值?

data = load 'log.txt' as (id:chararray,name:chararray);
grouped = group data by id;
foreach data {
filtered = filter group by group.id=data.id;
};

我尝试迭代组并过滤生成的包的一种方法。但我的情况是我必须迭代一个外部元组然后用这些结果必须从分组值中获取相应的包。我尝试了嵌套的foreach,但我得到了以下异常,

 expression is not a project expression: (Name: ScalarExpression) Type: null Uid: null)

尝试了几种无用的组合。

1 个答案:

答案 0 :(得分:0)

根据this,似乎是PIG-1798报告的错误。