如何将xml包导入databricks

时间:2019-05-28 04:16:36

标签: xml python-import databricks

任何人在关注xml之前都应遵循以下链接 https://github.com/databricks/spark-xml

我在导入导入com.databricks.spark.xml时一直遇到问题。_

错误

enter image description here

我的数据砖版本

enter image description here

实际上我也想知道如何安装软件包

$SPARK_HOME/bin/spark-shell --packages com.databricks:spark-xml_2.12:0.5.0

2 个答案:

答案 0 :(得分:0)

在Android Studio中使用此依赖项:

// https://mvnrepository.com/artifact/com.databricks/spark-xml
compile group: 'com.databricks', name: 'spark-xml_2.12', version: '0.5.0'

要获得更多帮助,请访问此链接:

https://mvnrepository.com/artifact/com.databricks

答案 1 :(得分:0)

您可以使用databricks主页上提供的导入库选项来安装软件包/库。

databricks-homepage

在这里选择maven选项并提供maven坐标,或者您也有权搜索包

maven

enter image description here

此后,您需要通过浏览Clusters> Libraries将库附加到您的群集。 现在,您可以直接使用以下库,而无需导入它。

df = spark.read.format('com.databricks.spark.xml').options(rowTag='book').load(' /FileStore/tables/sample.xml')