猪分布式缓存

时间:2015-03-22 07:12:41

标签: apache-pig distributed-cache pig-udf

getShipFiles&之间有什么区别? getCacheFiles课程中的EvalFunc

假设此方法中指定的任何文件可用于分布式缓存中的exec方法

1 个答案:

答案 0 :(得分:1)

<强> getCacheFiles() 允许UDF指定它希望放置在分布式缓存中的hdfs文件列表。

<强> getShipFiles() 允许UDF指定它希望放置在分布式缓存中的本地文件列表。

因此getShipFiles从本地文件中获取文件,而Cache从HDFS中获取文件。