我在数据砖中有一个笔记本,可以每天在特定时间运行该文件,并且还从该笔记本中创建了仪表板,如何在每次运行作业时自动导出仪表板结果?我知道Jobs API,但无法找出执行此操作的正确命令。现在,我正在使用python包databricks-api(https://pypi.org/project/databricks-api/)连接到databricks。我的最终目标是自动化运行笔记本,创建仪表板并保存结果的过程。
答案 0 :(得分:0)
您知道吗?我也有同样的问题。这不是完整的答案,但是要导出笔记本,请使用以下两个链接处演示的API:
此curl命令会将笔记本导出为HTML。它没有做的就是清楚地显示仪表板,没有代码,这很容易通过Databricks UI完成:
curl -n -H "Content-Type: application/json" -X GET -d @- https://<mysite>.cloud.databricks.com/api/2.0/workspace/export <<JSON
{
"path": "/Users/my@login.com/notebook_001",
"format": "HTML"
}
JSON
或手动下载html文件:
curl -n -o example.html "https://<yoursite>.cloud.databricks.com/api/2.0/workspace/export?format=HTML&direct_download=true&path=/Users/you@yourlogin.com/notebookname_001"
您可能已经远远超出了这个范围,但是根据此article,它假定使用.netrc和令牌。
[我很高兴进行编辑,以显示如何更改此过程以导出无代码的HTML,或者更好地在仪表板视图中。我也曾经浏览过Jobs API,但看不到它与已经运行的笔记本有什么关系,该笔记本不需要在线群集即可查看仪表板。]