我有一个Spark作业应用程序中所有活动作业的列表。
sc.statusTracker.getActiveJobIds().foreach(jobId => {
val job: SparkJobInfo = sc.statusTracker.getJobInfo(jobId).get
...
})
我有一段代码,做了一些基本的转换和动作。 例如:
val oldDf = dfInput.filter(age > 18)
val youngDf = dfInput.filter(age < 10)
oldDf.count()
youngDf.count()
如何在jobId和适当的转换之间链接?如何访问正在运行的作业的名称?
我的最终目标是要统计作业1中完成了多少任务,我想将作业1与 age> 18 过滤器转换链接。
谢谢。