如何从终端以Java运行Hadoop作业

时间:2019-02-22 01:29:17

标签: java hadoop

我是Java和Hadoop的新手。

我正在尝试从命令行运行脚本,但我不太理解参数。见下文。

 DistributedCache.addCacheFile((new Path(args[2])).toUri(), conf);
 DistributedCache.addCacheFile((new Path(args[3])).toUri(), conf);
 NLineInputFormat.addInputPath(job, new Path(args[0]));
 FileOutputFormat.setOutputPath(job, new Path (args[1]));

我知道以上每一行都是自变量。我相信第一个是输入路径(我正在读取的数据所在的位置),第二个是输出路径(最终输出将存储在哪里?) 但是,我不了解与DistributedCache.addCacheFile有关的第三个末尾第四个参数。任何解释将不胜感激。

0 个答案:

没有答案