标签: hadoop mapreduce
我有一个文件,其中包含文本格式的IP包头。
在map函数之后,为特定IP地址调用每个reduce方法。我想按排序顺序排列值,但它们没有排序。该值基本上是一行,其中有时间戳。我希望reduce中的所有值都按时间戳排序。
请帮我在哪里进行排序。
答案 0 :(得分:0)
Hadoop MapReduce有一个名为“Secondary Sort”的功能,可以满足您的需求。
“Hadoop the definitive guide”这本书有很好的章节。