正则表达式排除猪的文件

时间:2016-02-12 04:45:00

标签: regex hadoop apache-pig

您好我正在使用Pig将文件夹中的文件加载到HDFS中进行处理。文件夹名称的格式为MM-dd-yyyy。例如

/Test/02-10-2016/file1
/Test/02-11-2016/file2
/Test/20-12-2016/file3

同样/测试文件夹包括2015年1月1日至2016年12月20日期间的日期。在加载此文件夹时,我想要排除一些日期文件,例如02-10-2016,02-09-2016。

我知道我们可以在加载语句中使用正则表达式,如

ex = load '/TEST/*';

像这样如何使用正则表达式来排除load语句中的某些文件?

0 个答案:

没有答案