标签: hadoop data-partitioning hadoop-partitioning
在Hadoop中查找X数据范围有哪些方法,以便可以在reducer步骤中将这些范围用作分区?
答案 0 :(得分:0)
看起来你需要像TotalOrderPartitioner这样的东西,它通过从外部生成的源读取分割点来允许总订单。您可能会发现此链接很有用: http://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/。
不知道这是否正是您所需要的?如果我弄错了,请道歉。