我正在运行Mapreduce程序,我的输入目录有多个文件。让我们说
FILE1.TXT
FILE2.TXT
file3.txt
我想只使用file2.txt。如何在不删除输入目录中的剩余文件的情况下执行此操作?
答案 0 :(得分:0)
您可以在代码本身中指定文件名
代码:
FileInputFormat.addInputPath(job, "/inputfoldername/file2.txt");
或者你可以在运行时间进行
代码:
FileInputFormat.addInputPath(job, new Path(args[0]));
执行:
hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername
有关详细信息,请参阅https://ybhavesh.blogspot.com
中提供的一些Mapreduce POC希望这有助于!!! ...