标签: hadoop mapreduce
如何让我的所有映射器都可以访问一个变量,例如TreeMap个对象,而不必让每个映射器每次重新构建TreeMap?一旦构造了对象,它将永远不会被修改。
TreeMap
答案 0 :(得分:5)
考虑将TreeMap对象的内容放在Distributed Cache中。如果是少量数据,您可以将对象内容放在配置对象中:
Distributed Cache
conf.set("key", "value");
然后使用JobConf对象在映射器中访问它。