通过修改参数运行terasort
应用程序时,我收到以下错误。
15/05/24 21:41:42错误terasort.TeraSort:输入路径不存在:maprfs:/ user / user01 / -DXmx1024m
命令我正在运行以执行慢跑
$ hadoop jar /opt/mapr/hadoop/hadoop-0.20.2/hadoop-0.20.2-dev-\
examples.jar terasort –DXmx1024m –Dmapred.reduce.tasks=2 \
-Dio.sort.mb=1 /user/user01/6/TERA_IN /user/user01/6/TERA_OUT_2
如果我删除这些参数–DXmx1024m –Dmapred.reduce.tasks=2 -Dio.sort.mb=1
,那么一切正常。
我认为我正面对下面的错误,该错误发布在jira上,但是它适用于Windows https://issues.apache.org/jira/browse/HADOOP-8536
答案 0 :(得分:2)
这只是MapR LAB GUIDE的复制/粘贴问题。
只需从VM输入参数中将' - '更改为' - '。
通过复制/粘贴查看执行:
-bash-4.1$ hadoop jar /opt/mapr/hadoop/hadoop-0.20.2/hadoop-0.20.2-dev-\
> examples.jar terasort –DXmx1024m –Dmapred.reduce.tasks=2 \
> -Dio.sort.mb=1 /user/user01/6/TERA_IN /user/user01/6/TERA_OUT_2
15/10/26 15:24:57 INFO terasort.TeraSort: starting
15/10/26 15:24:59 ERROR terasort.TeraSort: Input path does not exist: maprfs:/user/user01/–DXmx1024m
-bash-4.1$
使用命令行修复执行:
-bash-4.1$ hadoop jar /opt/mapr/hadoop/hadoop-0.20.2/hadoop-0.20.2-dev-examples.jar terasort -DXmx1024m -Dmapred.reduce.tasks=2 -Dio.sort.mb=1 /user/user01/6/TERA_IN /user/user01/6/TERA_OUT_2
15/10/26 15:25:26 INFO terasort.TeraSort: starting
15/10/26 15:25:27 INFO input.FileInputFormat: Total input paths to process : 2
....
答案 1 :(得分:0)
你在运行terasort之前运行teragen吗?
你用过什么文件系统?为什么“maprfs”。如果不是故意的,请检查配置文件
15/05/24 21:41:42 ERROR terasort.TeraSort: Input path does not exist: **maprfs**:/user/user01/–DXmx1024m