如何使用 ADF 在数据块中安装 jar

时间:2021-07-28 08:09:53

标签: bash databricks azure-databricks

我们能够使用 UI 方法将 jar 文件安装到特定集群。但是我们要求在工作区中的所有按需集群上安装它。 我们正在使用以下 shell 脚本将 jar 文件下载到 DBFS。不确定我们如何使用全局初始化脚本在所有集群中引用/安装这个 jar

curl https://repo1.maven.org/maven2/com/databricks/spark-xml_2.12/0.12.0/spark-xml_2.12-0.12.0.jar >/dbfs/FileStore/jars/maven/com/databricks/spark_xml_2_12_0_12_0.jar

任何帮助将不胜感激!

2 个答案:

答案 0 :(得分:1)

有一种替代解决方案可以将 jar 库添加到作业集群中,该解决方案在运行我们的作业时从 Azure 数据工厂调用。

在 ADF 中,在调用笔记本时,我们可以选择将 jar 目录包含在 DBFS 中,或者我们可以提供 Maven 坐标。

ADF SETTINGS

答案 1 :(得分:0)

在全局初始化脚本中,您可以将此文件下载到 /databricks/jars/ 目录 - 然后它会被集群拾取

相关问题