标签: hadoop mapreduce
我正在运行mapreduce工作,需要大约300mb的第三方库。为了避免在运行作业时将库复制到数据节点的成本。我想知道是否有一种方法/工具可以在作业开始之前将这些库预先部署到所有数据节点。
提前致谢。
答案 0 :(得分:3)
您可以将其部署到Hadoop的分布式缓存中。 Pere Ferrera Bertran explains this well