Hadoop WordCount示例 - 实现排序

时间:2010-10-22 16:21:33

标签: hadoop

我是Hadoop的新手。我已经能够成功运行WordCount示例。

我想修改此示例,以便我的输出按计数的升序排序。我无法弄清楚我需要做哪些必要的修改。

如果有人给我一些方向来实现排序,那会很棒吗?

1 个答案:

答案 0 :(得分:0)

请参阅org.apache.hadoop.examples.Sort

使用map / reduce不是非常简单。它涉及获取数据的直方图并使用TotalOrderPartitioner

或者,您可以使用Hive或Pig,它具有用于排序的内置函数。