标签: file caching hadoop distributed
我们如何更新hadoop的分布式缓存中的文件。 选项:
我用谷歌搜索但无法找到我的问题的答案,所以发布在这里。 希望我能得到答案。
答案 0 :(得分:0)
当mapreduce作业正在运行时,您无法更新DistributedCache,否则它将成为一个关键的竞赛。
您必须重新启动作业,并且只需提交另一个DistributedCache数据 - 作业之间不存在DistributedCache持久性。