hadoop中的分布式缓存

时间:2014-02-21 03:55:06

标签: file caching hadoop distributed

我们如何更新hadoop的分布式缓存中的文件。 选项:

  1. 更新分布式缓存中的文件并重新启动mapreduce作业。
  2. 用新文件替换文件,并将指针位置更改为指向新位置并重新启动map reduce job。
  3. 将新值附加到分布式缓存中并重新启动map reduce job。
  4. 其他选择是......
  5. 我用谷歌搜索但无法找到我的问题的答案,所以发布在这里。 希望我能得到答案。

1 个答案:

答案 0 :(得分:0)

当mapreduce作业正在运行时,您无法更新DistributedCache,否则它将成为一个关键的竞赛。

您必须重新启动作业,并且只需提交另一个DistributedCache数据 - 作业之间不存在DistributedCache持久性。