hadoop jar /home/yogesh/WordCount.jar WordCount /user/yogesh/Input/test.txt /user/yogesh/Output/output1
我遇到以下错误:
线程“main”中的异常
org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:hdfs:host / user / yogesh / WordCount。
hdfs:host / user / yogesh / - 是我的HDFS目录。我无法理解为什么这个MR工作在HDFS中寻找代码以及如何解决这个错误。
答案 0 :(得分:0)
尝试将WordCount类的名称包作为其前缀,或者只是跳过该类并使用jar,输入,输出,如下所示:
hadoop jar /home/yogesh/WordCount.jar /user/yogesh/Input /user/yogesh/Output/output1
此外,请确保在执行此命令之前/user/yogesh/Output/output1
不存在。另外,请注意您应该提供输入目录而不是输入文件。 Hadoop将把指定目录中的所有文件作为输入。
有关示例,请参阅this site中的WordCount示例运行方式。