标签: hadoop mapreduce apache-pig
如何在我实现LoadFunc UDF的自定义数据加载函数中使用分布式缓存? 在EvalFunc UDF中,它提供了一种方法getCacheFiles()。
LoadFunc UDF
EvalFunc UDF
getCacheFiles()
答案 0 :(得分:0)
结帐this。或者,您可以传入一个文件以通过构造函数添加到缓存中,并在setLocation方法中进行设置。在那里,您可以访问Job对象。