获取所有用户执行的spark目标的目标目录/位置

时间:2017-02-03 07:25:17

标签: apache-spark

我正在研究报告工具,我需要找出群集中所有用户执行的已保存的火花作业RDD的输出位置。我尝试了spark历史服务器API / spark事件日志/ spark侦听器/ YARN日志,但无法获取已执行作业的位置。

提前谢谢你......

1 个答案:

答案 0 :(得分:0)

最终输出位于您传递给HadoopRDD或数据帧上调用的{{write(path:String)}}的路径下。