DistributedCache - 在内存中加载文件

时间:2014-09-22 17:47:18

标签: hadoop mapreduce apache-pig distributed-cache

hadoop中是否有任何方法可以覆盖在作业开始之前调用的方法? 我想从分布式缓存加载一个文件。我不能把它放在mapper类的setup方法上,因为我将有很多映射器。我将使用MultipleInputs。

我将根据分布式缓存中的文件过滤输入。

谢谢!

0 个答案:

没有答案