如何将作业所需的库部署到所有数据节点?

时间:2012-06-13 07:50:43

标签: hadoop mapreduce

我正在运行mapreduce工作,需要大约300mb的第三方库。为了避免在运行作业时将库复制到数据节点的成本。我想知道是否有一种方法/工具可以在作业开始之前将这些库预先部署到所有数据节点。

提前致谢。

1 个答案:

答案 0 :(得分:3)

您可以将其部署到Hadoop的分布式缓存中。 Pere Ferrera Bertran explains this well