使用Oozie启动Spark工作失败(Error MetricsSystem)

时间:2017-05-15 09:58:55

标签: scala apache-spark oozie spark-submit

我有一个火花罐,我用 spark-submit 启动它,它工作正常(读取文件,生成RDD,存储在hdfs中)。但是,当我尝试在Oozie作业(oozie:spark-action)中启动相同的jar时,火花作业失败。

当我查看日志时,显示的第一个错误是:

  

错误MetricsSystem:Sink类   org.apache.spark.metrics.sink.MetricsServlet无法实例化。

此外,当我开始使用spark脚本时,我发现问题与 saveAsText 功能有关。当我在没有写入HDFS的情况下吃同样的火花工作时,整个工作流程都运行良好。

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

问题出在我正在执行oozie工作的群集一侧。

我需要明确地在工作流程中添加参数,因为它们没有被考虑在内:

< spark-opts> - 队列HQ_IBNF --conf“spark.executor.extraJavaOptions = -Djava.library.path = / opt / application / Hadoop / current / lib / native”< / spark-opts>