在mapreduce中映射函数后对键值对进行排序

时间:2011-05-16 21:26:08

标签: hadoop mapreduce

我有一个文件,其中包含文本格式的IP包头。

在map函数之后,为特定IP地址调用每个reduce方法。我想按排序顺序排列值,但它们没有排序。该值基本上是一行,其中有时间戳。我希望reduce中的所有值都按时间戳排序。

请帮我在哪里进行排序。

1 个答案:

答案 0 :(得分:0)

Hadoop MapReduce有一个名为“Secondary Sort”的功能,可以满足您的需求。

Hadoop the definitive guide”这本书有很好的章节。