我需要一个可以在reducer中同时读取/设置的全局变量(我知道这种设计的瓶颈和性能问题)。我尝试使用Hadoop配置get()/ set(),但我发现需要在提交mapreduce作业之前设置配置属性,并且在reducer中使用Configuration.set()实际上并不更新全局属性的值
我能找到的最近的事情是使用一个全局参数,而不是可以通过套接字读取/设置到Hadoop作业跟踪器,但我找不到任何资源说明如何做到这一点。
我的问题是:
注意:
答案 0 :(得分:1)
通常,在Hadoop集群中存储可靠一致的全局变量的地方是Apache ZooKeeper。
也就是说,在MapReduce作业中很少需要可变的全局变量。如果你分享你的用例,很有可能会有一个更简单的解决方案。