在 zeppelin 中完成一个进程后,有没有办法运行单独的笔记本?

时间:2021-04-18 03:10:02

标签: pyspark apache-zeppelin

假设以下是示例流程

Notebook1

df.count()
df.show()
Notebook2

df2.count()
df2.show()

我想在 Notebook1 完成后在 zeppelin 上调用 Notebook2。

2 个答案:

答案 0 :(得分:0)

需要访问调度系统(例如:azakaban),zeppelin不提供note依赖

答案 1 :(得分:0)

有两种方式

  1. 在notebook1的最后一段末尾,可以调用 z.run("", "notebook2 的段落");

  2. zeppelin 中有一个 rest call( pivot_wider() ),你可以通过它来检查段落的状态,例如运行状态或完成状态。一旦获得 notebook1 的最后一段的完成状态,就可以调用 notebook2 的段落。

更多参考:https://zeppelin.apache.org/docs/0.8.1/usage/rest_api/notebook.html#get-the-status-of-a-single-paragraph