Zeppelin - 按顺序运行段落

时间:2017-08-08 06:18:39

标签: apache-spark apache-zeppelin

我在2台主机上安装了spark 2.1个独立群集。 有两个笔记本Zeppelin(0.7.1)

  • 第一个:通过以下方式准备数据,进行聚合并将输出保存到文件中:

    data.write.option("header", "false").csv(file)

  • 第二个:带有shell段落的笔记本将所有部分*文件从spark输出合并到一个文件

我想问两个案例:

  • 如何配置Spark以将输出写入一个文件
  • 完成笔记本1之后如何添加关系来运行notebook2中的所有段落,例如: 笔记本1:

    data.write.option("header", "false").csv(file)

    “运行notebook2”

    NOTEBOOK2:

    shell code

1 个答案:

答案 0 :(得分:0)

您是否尝试在note1末尾添加一个段落,通过Zeppelin API执行note2?您可以选择添加一个循环来检查是否所有段落都已完成执行,也可以通过API。