Hadoop Map程序打印输入文件

时间:2014-06-06 19:14:49

标签: hadoop mapreduce reduce

所以我一直在尝试编写一个hadoop程序,它将输入作为一个包含许多文件的文件,我希望hadoop程序的输出只是输入文件的一行。但我无法做到这一点。我也不想要减速机类。如果有人可以帮助我,那就太好了。

1 个答案:

答案 0 :(得分:0)

您可以在映射器中使用filesplit仅处理特定文件。

FileSplit fileSplit = (FileSplit)context.getInputSplit();
String filename = fileSplit.getPath().getName();