我是Java和Hadoop的新手。
我正在尝试从命令行运行脚本,但我不太理解参数。见下文。
DistributedCache.addCacheFile((new Path(args[2])).toUri(), conf);
DistributedCache.addCacheFile((new Path(args[3])).toUri(), conf);
NLineInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path (args[1]));
我知道以上每一行都是自变量。我相信第一个是输入路径(我正在读取的数据所在的位置),第二个是输出路径(最终输出将存储在哪里?) 但是,我不了解与DistributedCache.addCacheFile有关的第三个末尾第四个参数。任何解释将不胜感激。