标签: hadoop
这可能听起来很基本,但我在HDFS中有一个包含3种文件的文件夹。 例如: 访问02171990 s3.Log catalina.out中
我希望我的map / reduce只读取以access-only开头的文件。我如何通过程序这样做?或通过输入目录路径指定? 请帮忙。
答案 0 :(得分:3)
您可以将输入路径设置为glob:
FileInputFormat.addInputPath(jobConf, new Path("/your/path/access*"))