标签: hadoop mapreduce apache-pig distributed-cache
hadoop中是否有任何方法可以覆盖在作业开始之前调用的方法? 我想从分布式缓存加载一个文件。我不能把它放在mapper类的setup方法上,因为我将有很多映射器。我将使用MultipleInputs。
我将根据分布式缓存中的文件过滤输入。
谢谢!