有没有办法在Hadoop管理Web界面中从mrjob指定作业的标题?

时间:2013-03-20 22:36:21

标签: python mapreduce hadoop-streaming mrjob

我从Python库mrjob开始了几个不同的工作,包括具有多个步骤的工作。如何使用自定义名称替换streamjob?例如,wordcount_step_1wordcount_step_2

screenshot of Hadoop Administration

2 个答案:

答案 0 :(得分:5)

当然,只需在执行作业时使用--jobconf选项指定它。

例如:

if __name__ == '__main__':
    # Be careful, this appends all job args, if you have lots it could be a problem
    sys.argv.extend(["--jobconf", "mapred.job.name=%s" % " ".join(sys.argv)])
    MRYourJobClass.run()

答案 1 :(得分:0)

运行作业时,请添加选项:

--jobconf mapred.job.name=NameOfTheJob