获取hadoop中退休工作的详细信息

时间:2013-12-27 09:46:22

标签: java hadoop

我需要使用Java在hadoop作业跟踪器中获取以下有关已退役作业的详细信息。

  • 工作ID
  • 用户
  • 姓名(职位)
  • 状态
  • 开始时间
  • 结束时间。
  • 持续时间

基本上上述大部分内容均由jobtracker.jsp网址显示。

我需要捕获它们以用于审计目的。

请告诉我如何访问上述字段。

代码示例非常有用

使用下面提到的代码,我只能获得已完成的工作详细信息,示例代码段:

JobClient client = new JobClient(getConf());    
for (JobStatus job : client.getAllJobs()) {    
    if (job.isJobComplete()) {    
        Stirng jobName = job.getJobName();    
        int jobStatus = job.getJobStatus();    
        // .. you get the idea    
    }    
}   

需要帮助!!

谢谢你提前!!!!

1 个答案:

答案 0 :(得分:0)

我想你需要办理登机手续

在工作历史中

密钥: hadoop.job.history.location

密钥(H21): mapreduce.jobtracker.jobhistory.location

默认: file:/// $ {hadoop.log.dir} / history

保留:最多30天(见下面的一般工作文件说明)

注意:此键的值被视为URI,换句话说,您可以将作业文件存储在HDFS或本地文件系统中(这是默认值)。

了解更多信息

http://blog.cloudera.com/blog/2010/11/hadoop-log-location-and-retention/