在我的map-reduce作业中,mapper的输出类型为<Text, FileAlias>
,而类FileAlias
有两个属性,如下所示
public class FileAlias extends Configured implements WritableComparable<FileAlias>{
public boolean isAlias;
public String value;
...
}
对于每个输出键(类型为Text
),只有一个输出值(类型为FileAlias
)的属性isAlias
设置为true。我希望这个输出值是OutputCollector
送到reducer的第一个项目。有没有办法做到这一点?
答案 0 :(得分:0)
查看Job
对象上的setGroupingComparatorClass方法。您应该能够实现一个比较器,该比较器首先在传递给reduce任务的Iterable中使用FileAlias
isAlias == true
。