在Apache Pig中使用LoadFunc中的分布式缓存

时间:2014-04-17 06:43:11

标签: hadoop mapreduce apache-pig

如何在我实现LoadFunc UDF的自定义数据加载函数中使用分布式缓存? 在EvalFunc UDF中,它提供了一种方法getCacheFiles()

1 个答案:

答案 0 :(得分:0)

结帐this。或者,您可以传入一个文件以通过构造函数添加到缓存中,并在setLocation方法中进行设置。在那里,您可以访问Job对象。