标签: hadoop mapreduce
我有两个文件
(1,2,3,4), (6,7,8,9), (4,5,3,8), (1,2,5,6)...
(1,2)
现在我想要比较两个输入并基于输入2中的记录,即(1,2)我想从输入1中删除包括(1,2)的所有记录,所以在我们的情况下我需要OUTPUT作为
Output - (6,7,8,9), (4,5,3,8)...
任何想法我们如何在MapReduce或算法中做什么都会对我有帮助..