MapReduce分布式缓存

时间:2010-07-02 10:06:05

标签: caching distributed mapreduce

我正在使用

将文件添加到Hadoop的分布式缓存中
     Configuration cng=new Configuration();
     JobConf conf = new JobConf(cng, Driver.class);
     DistributedCache.addCacheFile(new Path("DCache/Orders.txt").toUri(), cng);

其中DCache / Orders.txt是HDFS中的文件。

当我尝试使用以下方法在mapper的configure方法中从缓存中检索此文件时使用:

    Path[] cacheFiles=DistributedCache.getLocalCacheFiles(conf);

我得到空指针。可能是什么错误?

由于

1 个答案:

答案 0 :(得分:1)

DistributedCache在单节点模式下不起作用,它只返回一个空指针。或者至少这是我对当前版本的体验。

我认为url应该以hdfs标识符开头。

http://hadoop.apache.org/common/docs/current/mapred_tutorial.html#DistributedCache