我正在使用
将文件添加到Hadoop的分布式缓存中 Configuration cng=new Configuration();
JobConf conf = new JobConf(cng, Driver.class);
DistributedCache.addCacheFile(new Path("DCache/Orders.txt").toUri(), cng);
其中DCache / Orders.txt是HDFS中的文件。
当我尝试使用以下方法在mapper的configure方法中从缓存中检索此文件时使用:
Path[] cacheFiles=DistributedCache.getLocalCacheFiles(conf);
我得到空指针。可能是什么错误?
由于
答案 0 :(得分:1)
DistributedCache在单节点模式下不起作用,它只返回一个空指针。或者至少这是我对当前版本的体验。
我认为url应该以hdfs标识符开头。
http://hadoop.apache.org/common/docs/current/mapred_tutorial.html#DistributedCache