Mapper的分类输出

时间:2016-01-05 20:04:55

标签: hadoop mapreduce

我有以下数据列表。

BLOKA, S1
BLOKB, I2
BLOKB, S3
BLOKA, I2
BLOKA, I1
BLOKB, I1
BLOKB, S3

由于有两个键,数据将转到两个减速器。如何以排序顺序实现减速器接收值,如下所示?

BLOK A, [I1, I2, S1]
BLOK B, [I2, I2, S3, S3]

0 个答案:

没有答案