在Hadoop中生成多个大小相同的输出文件

时间:2013-06-19 19:27:51

标签: hadoop data-partitioning hadoop-partitioning

在Hadoop中查找X数据范围有哪些方法,以便可以在reducer步骤中将这些范围用作分区?

1 个答案:

答案 0 :(得分:0)

看起来你需要像TotalOrderPartitioner这样的东西,它通过从外部生成的源读取分割点来允许总订单。您可能会发现此链接很有用: http://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/

不知道这是否正是您所需要的?如果我弄错了,请道歉。