Hadoop在Reduce Side Join中按值排序

时间:2015-12-16 23:23:06

标签: sorting hadoop

因此,我正在进行一些Hadoop培训,以便了解这片土地,并且我正在尝试进行减少侧连接,除了次要排序之外,我已经运行了。

基础知识:

两个文件
一个有球员,球队,薪水 另一个有球员,球队,本垒打

输出应该是团队,球员,薪水,本垒打

纽约大都会队应该被分成一个档案,而所有其他糟糕的队伍应该被分配到另一个档案中。

这些文件中的每一个都应按团队排序,其次是玩家工资。

我正在使用团队密钥,playerID加入并且有效,但我不知道如何按工资排序,因为这两个文件中只有一个有。

这是一项可能的任务,还是只能通过地图侧加入完成?

0 个答案:

没有答案