我正在尝试将s3distcp用于EMR作业并获得此异常:
Exception in thread "main" java.lang.RuntimeException: Argument --arg doesn't match.
at emr.hbase.options.Options.parseArguments(Options.java:75)
at emr.hbase.options.Options.parseArguments(Options.java:57)
at com.amazon.external.elasticmapreduce.s3distcp.S3DistCp.run(S3DistCp.java:151)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79)
at com.amazon.external.elasticmapreduce.s3distcp.Main.main(Main.java:12)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.RunJar.main(RunJar.java:187)
控制器显示它正在运行:
2013-11-03T00:54:52.277Z INFO Executing /usr/java/latest/bin/java -cp /home/hadoop/conf:/usr/java/latest/lib/tools.jar:/home/hadoop:/home/hadoop/hadoop-tools.jar:/home/hadoop/hadoop-tools-1.0.3.jar:/home/hadoop/hadoop-core-1.0.3.jar:/home/hadoop/hadoop-core.jar:/home/hadoop/lib/*:/home/hadoop/lib/jetty-ext/* -Xmx1000m -Dhadoop.log.dir=/mnt/var/log/hadoop/steps/1 -Dhadoop.log.file=syslog -Dhadoop.home.dir=/home/hadoop -Dhadoop.id.str=hadoop -Dhadoop.root.logger=INFO,DRFA -Djava.io.tmpdir=/mnt/var/lib/hadoop/steps/1/tmp -Djava.library.path=/home/hadoop/native/Linux-amd64-64 org.apache.hadoop.util.RunJar /mnt/var/lib/hadoop/steps/1/s3distcp.jar --arg --src --arg 's3://s3bucket/s3/' --arg --dest --arg hdfs:///tmp/mrjob/mrjob-jobid/step-output/1/ --arg --groupBy --arg 'd-0-([0-9]+-[0-9]+).log.gz'
对我来说看起来完全没问题。有没有人知道为什么它不匹配--arg?
谢谢!
答案 0 :(得分:1)
我认为hdfs:/// tmp / mrjob / mrjob-jobid / step-output / 1 /可能必须用单引号括起来。
我看到语法是这样的:
--arg S3DistCp-OptionName1 --arg 'S3DistCp-OptionValue1'
答案 1 :(得分:0)
您还希望将EMR步骤参数括在引号中:
--arg "--src" --arg 's3://s3bucket/s3/' --arg "--dest" ...
我认为单引号或双引号应该有用。