正如您可以参考快照一样,当您第一次运行Apache Zeppelin笔记本时,完成作业需要很长时间(大约超过1分钟)。
有没有什么方法可以优化以减少运行时间?
答案 0 :(得分:4)
简答:
你不能让第一份工作更快。
更长的回答:
作业处理速度不是很慢,但在另一方面初始化SparkSession
或SparkContext
是
Zeppelin所做的是在你打电话的第一份工作上启动一个Spark会话。简单的例子:
进行简单的值分配花了一分钟。
因此除非spark
本身开始变得更快,否则你实际上没有什么可以做的更快。
答案 1 :(得分:0)
zeppelin正在询问解释命令所需的资源。 在纱线客户模式下,它还需要等到纱线接受您的应用。 所以,你的第一台笔记本超过1分钟..
答案 2 :(得分:0)
最后,我发现在两种情况下你可以使它更快,在spark版本< 1.6并拥有群集中的完整资源。