应用错误收集

Zeppelin - 按顺序运行段落

时间：2017-08-08 06:18:39

标签： apache-spark apache-zeppelin

我在2台主机上安装了spark 2.1个独立群集。有两个笔记本Zeppelin(0.7.1)：

第一个：通过以下方式准备数据，进行聚合并将输出保存到文件中：

data.write.option("header", "false").csv(file)
第二个：带有shell段落的笔记本将所有部分*文件从spark输出合并到一个文件

我想问两个案例：

如何配置Spark以将输出写入一个文件
完成笔记本1之后如何添加关系来运行notebook2中的所有段落，例如：笔记本1：

data.write.option("header", "false").csv(file)

“运行notebook2”

NOTEBOOK2：

shell code

1 个答案:

答案 0 :(得分：0)

您是否尝试在note1末尾添加一个段落，通过Zeppelin API执行note2？您可以选择添加一个循环来检查是否所有段落都已完成执行，也可以通过API。