我在2台主机上安装了spark 2.1
个独立群集。
有两个笔记本Zeppelin(0.7.1)
:
第一个:通过以下方式准备数据,进行聚合并将输出保存到文件中:
data.write.option("header", "false").csv(file)
第二个:带有shell段落的笔记本将所有部分*文件从spark输出合并到一个文件
我想问两个案例:
完成笔记本1之后如何添加关系来运行notebook2中的所有段落,例如: 笔记本1:
data.write.option("header", "false").csv(file)
“运行notebook2”
NOTEBOOK2:
shell code
答案 0 :(得分:0)
您是否尝试在note1末尾添加一个段落,通过Zeppelin API执行note2?您可以选择添加一个循环来检查是否所有段落都已完成执行,也可以通过API。