Hadoop聚合两个功能

时间:2016-12-18 19:36:10

标签: java hadoop mapreduce

我有以下文件:

Item1 : frequencyOfItem1
Item2 : frequencyOfItem2
...
ItemN : frequencyOfItemN

经过一些界限......

Pair1: Item1, Item2  Value1
Pari2: ItemX, ItemY  Value2

...

PairN: ItemXN, ItemYN ValueN

我想用map-reduce方式计算以下新值:

ParirX: ItemX, ItemY ValueX/FrequencyItemNX

如何映射和减少值呢?

1 个答案:

答案 0 :(得分:0)

通过合并两项工作来解决这个问题是可能的

  1. 映射器:在映射器中,键是ItemX并且值为所有其他元素
  2. Reducer:输出所有值(这样我就是根据ItemX连接值
  3. JOB2

    1. 映射两个键,一个键是整行,值是ValueX,第二个键是整行和值是FrequencyItemNX
    2. Reducer输出键值之间的分区