我正在编写一个hadoop作业,它应该收集在集群中运行的所有作业的开始和结束时间,并将此数据上传到blob。但是,我不确定如何获取此信息,因为作业似乎无法访问作业跟踪器。有什么想法吗?
答案 0 :(得分:0)
您可以使用班级getLaunchTime()提供的getFinishTime()和JobInProgress方法。 API还有一个JobTracker类,它提供getJobsFromQueue(String queue)方法,可用于获取提交到特定队列的所有作业。
除了这些方法之外,这些类还有一些其他非常有用的方法,您可能会发现它们很有帮助。
HTH