标签: hive apache-pig
我想使用Pig / Hive处理过去5分钟内在HDFS目录中收到的文件。例如,我有一个不同的团队,他们在HDFS目录下每隔5分钟发送一次XML文件。我是否需要尝试查找/ path -cmin -5来加载文件?需要指导。