我需要使用Java在hadoop作业跟踪器中获取以下有关已退役作业的详细信息。
基本上上述大部分内容均由jobtracker.jsp
网址显示。
我需要捕获它们以用于审计目的。
请告诉我如何访问上述字段。
代码示例非常有用
使用下面提到的代码,我只能获得已完成的工作详细信息,示例代码段:
JobClient client = new JobClient(getConf());
for (JobStatus job : client.getAllJobs()) {
if (job.isJobComplete()) {
Stirng jobName = job.getJobName();
int jobStatus = job.getJobStatus();
// .. you get the idea
}
}
需要帮助!!
谢谢你提前!!!!
答案 0 :(得分:0)
我想你需要办理登机手续
在工作历史中
密钥: hadoop.job.history.location
密钥(H21): mapreduce.jobtracker.jobhistory.location
默认: file:/// $ {hadoop.log.dir} / history
保留:最多30天(见下面的一般工作文件说明)
注意:此键的值被视为URI,换句话说,您可以将作业文件存储在HDFS或本地文件系统中(这是默认值)。
了解更多信息
http://blog.cloudera.com/blog/2010/11/hadoop-log-location-and-retention/