比较MapReduce中的两个输入文件

时间:2017-11-22 17:43:50

标签: hadoop mapreduce

我有两个文件

  • 输入1为(1,2,3,4), (6,7,8,9), (4,5,3,8), (1,2,5,6)...
  • 输入2为(1,2)

现在我想要比较两个输入并基于输入2中的记录,即(1,2)我想从输入1中删除包括(1,2)的所有记录,所以在我们的情况下我需要OUTPUT作为

Output - (6,7,8,9), (4,5,3,8)...

任何想法我们如何在MapReduce或算法中做什么都会对我有帮助..

0 个答案:

没有答案