线程“main”中的异常org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:hdfs:host / user / yogesh / WordCount

时间:2016-02-26 13:48:05

标签: hadoop mapreduce hdfs

  1. 我创建了输入文本文件test.txt并将其作为/user/yogesh/Input/test.txt
  2. 放到HDFS中
  3. 在HDFS上创建输出路径为/ user / yogesh / Output
  4. 在本地/home/yogesh/WordCount.jar上创建了jar文件,并从本地提交了MR作业,如:hadoop jar /home/yogesh/WordCount.jar WordCount /user/yogesh/Input/test.txt /user/yogesh/Output/output1
  5. 我遇到以下错误:

      

    线程“main”中的异常
    org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:hdfs:host / user / yogesh / WordCount。

    hdfs:host / user / yogesh / - 是我的HDFS目录。我无法理解为什么这个MR工作在HDFS中寻找代码以及如何解决这个错误。

1 个答案:

答案 0 :(得分:0)

尝试将WordCount类的名称包作为其前缀,或者只是跳过该类并使用jar,输入,输出,如下所示:

hadoop jar /home/yogesh/WordCount.jar /user/yogesh/Input /user/yogesh/Output/output1

此外,请确保在执行此命令之前/user/yogesh/Output/output1不存在。另外,请注意您应该提供输入目录而不是输入文件。 Hadoop将把指定目录中的所有文件作为输入。

有关示例,请参阅this site中的WordCount示例运行方式。