-Dmapred.job.name不适用于s3-dist-cp命令

时间:2020-04-10 10:36:09

标签: hadoop amazon-s3 mapreduce distcp s3distcp

我想使用s3-dist-cp将一些文件从emr-hdfs复制到s3存储桶,我已经尝试了来自“ EMR主节点”的cmd:

s3-dist-cp -Dmapred.job.name=my_copy_job --src hdfs:///user/hadoop/abc s3://my_bucket/my_key/

此命令执行正常,但是当我在yarn资源管理器UI中检查作业名称时,它显示如下: S3DistCp hdfs:///user/hadoop/abc **->** s3://my_bucket/my_key/

而预期的工作名称应该是my_copy_job

感谢您的帮助!

注意: 当我使用此选项-Dmapred.job.name=my_copy_job运行hadoop distcp时,它在yarn RM UI中正确显示了作业名称,但该作业最终失败了

1 个答案:

答案 0 :(得分:1)

s3-dist-cp不支持-D那样在运行时设置的hadoop distcp样式属性。 S3 Distcp仅接受here中列出的有限选项集。除了S3DistCp定义的这些选项之外,它还接受Tool Interface's通用选项。

但是JobName不是其中之一。在S3DistCp代码中,JobNamehardcoded,无法覆盖。