如何让Apache Zeppelin笔记本在第一份工作中运行得更快

时间:2017-02-05 13:37:38

标签: apache-spark apache-zeppelin

zeppelin notebook snapshot

正如您可以参考快照一样,当您第一次运行Apache Zeppelin笔记本时,完成作业需要很长时间(大约超过1分钟)。

有没有什么方法可以优化以减少运行时间?

3 个答案:

答案 0 :(得分:4)

简答:

你不能让第一份工作更快。

更长的回答:

作业处理速度不是很慢,但在另一方面初始化SparkSessionSparkContext

Zeppelin所做的是在你打电话的第一份工作上启动一个Spark会话。简单的例子:

enter image description here

进行简单的值分配花了一分钟。

因此除非spark本身开始变得更快,否则你实际上没有什么可以做的更快。

答案 1 :(得分:0)

zeppelin正在询问解释命令所需的资源。 在纱线客户模式下,它还需要等到纱线接受您的应用。 所以,你的第一台笔记本超过1分钟..

答案 2 :(得分:0)

最后,我发现在两种情况下你可以使它更快,在spark版本< 1.6并拥有群集中的完整资源。