标签: hadoop mapreduce
我有以下数据列表。
BLOKA, S1 BLOKB, I2 BLOKB, S3 BLOKA, I2 BLOKA, I1 BLOKB, I1 BLOKB, S3
由于有两个键,数据将转到两个减速器。如何以排序顺序实现减速器接收值,如下所示?
BLOK A, [I1, I2, S1] BLOK B, [I2, I2, S3, S3]