应用错误收集

我想使用自己喜欢的编辑器在本地编辑Databricks笔记本，然后使用Databricks Connect在通常通过Web界面访问的Databricks群集上远程运行笔记本。

不幸的是，在网上搜索了几天后，我找不到有关Databricks Connect的详细文档。

我按照上面的PyPI页面上的建议运行databricks-connect configure，但不确定某些设置。有人可以指导我完成此操作（例如在Web界面中的哪里找到这些值）或提供指向正确文档的链接吗？

我知道某些设置应该是什么，但是我将包括运行databricks-connect configure时出现的所有信息，以确保其他设置的完整性和益处。

Databricks Host
Databricks Token
Cluster ID（例如0921-001415-jelly628）
Org ID（仅限天蓝色，请参见URL中的?o=orgId）
Port（是spark.databricks.service.port吗？）

而且，我认为这是我最感兴趣的，是否需要对笔记本本身进行任何更改，例如定义SparkContext或其他内容？如果可以，采用什么配置？

我应该如何运行它？运行databricks-connect configure之后，似乎没有发生任何“魔术”。当我运行jupyter notebook时，它仍然在本地运行，并且似乎不知道将其转发到远程集群。

更新：如果您想考虑更具体的内容，在Databricks的Web界面中，dbutils是预定义的对象。远程运行笔记本时如何使用它？

使用Databricks Connect

2 个答案: