关于HDP性能问题的Spark 2.31自定义非ambari安装

时间:2018-12-18 01:52:40

标签: apache-spark yarn hdp

我在集群上运行的HDP 2.6.2上安装了Spark 2.3.1自定义非ambari安装。我已经按照spark和non ambari安装指南进行了所有必要的配置。

现在,当我以纱线群集模式提交spark作业时,我看到作业之间有10到12分钟的巨大差距,而且看不到作业之间正在执行的任何错误或操作。随附的屏幕截图显示作业之间的延迟接近10分钟,这导致完成Spark作业不必要的延迟。 Spark 2.3.1 job submitted in Yarn Cluster mode

我已经检查了Yarn日志和Spark UI,但看不到任何错误或作业之间带有时间戳记的任何操作。

浏览事件时间轴,我发现工作之间的间隔为10分钟以上。 Event timeline gap between the jobs

需要帮助,以提供任何指针来了解如何解决此问题并提高工作绩效。

关于, Vish

0 个答案:

没有答案