我使用hadoop map并减少程序。我需要读取一个多文件并将其输出到多个文件
示例
Input \ one.txt
two.txt
three.txt
Output \
one_out.txt
two_out.txt
我需要得到这样的东西。我怎样才能做到这一点。
请帮助我
谢谢
答案 0 :(得分:1)
isSplittable(false)
。它将确保hadoop不会跨映射器拆分文件,并且不会为每个输入文件生成多个输出文件