每n分钟加载一次收到的文件

时间:2014-08-03 22:20:25

标签: hive apache-pig

我想使用Pig / Hive处理过去5分钟内在HDFS目录中收到的文件。例如,我有一个不同的团队,他们在HDFS目录下每隔5分钟发送一次XML文件。我是否需要尝试查找/ path -cmin -5来加载文件?需要指导。

0 个答案:

没有答案