Python hadoop streaming:设置一个工作名称

时间:2012-07-17 18:14:33

标签: python hadoop mapreduce hadoop-streaming

  • 我有一个使用hadoop-streaming
  • 在我的集群上运行的作业
  • 我必须开始一项新工作,我想为其添加一个工作名称,如何在命令行或文件中传递该选项以设置工作名称?
  • 在Java中,您可以通过
  • 来完成此操作
JobConf conf = new JobConf(WordCount.class);
conf.setJobName("wordcount");

我怎么能用hadoop-streaming做到这一点?

1 个答案:

答案 0 :(得分:10)

使用-D key = value表示法配置属性:

-D mapred.job.name='My Job'

您可以通过仅使用-info参数

调用流式传输jar来列出一大堆选项