我正在传递文件模式:
FileInputFormat.addInputPath(job, new Path("/path/to/file*"));
我希望知道哪些文件在作业完成后实际匹配,只要它成功。
我试过了:
job.getConfiguration().get("mapreduce.input.fileinputformat.inputdir")
但它返回同样的事情:
"/path/to/file*"
我想知道是否有一种获取匹配路径的方法,而不需要创建另一个例程来扫描目录。
非常感谢你的启蒙。
答案 0 :(得分:0)
尝试此链接,它有几种方法可以在映射器中获取路径。但是,我确信它还会讨论更多的方法。 :)
How to get the input file name in the mapper in a Hadoop program?