如何从目录中选择特定的输入文件到Mapreduce程序

时间:2017-07-13 18:50:18

标签: java hadoop mapreduce

我正在运行Mapreduce程序,我的输入目录有多个文件。让我们说

  • FILE1.TXT

  • FILE2.TXT

  • file3.txt

我想只使用file2.txt。如何在不删除输入目录中的剩余文件的情况下执行此操作?

1 个答案:

答案 0 :(得分:0)

您可以在代码本身中指定文件名

代码:

 FileInputFormat.addInputPath(job, "/inputfoldername/file2.txt");

或者你可以在运行时间进行

代码:

 FileInputFormat.addInputPath(job, new Path(args[0]));

执行:

 hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername

有关详细信息,请参阅https://ybhavesh.blogspot.com

中提供的一些Mapreduce POC

希望这有助于!!! ...