将spark-xml_2.11文件添加到databricks库并创建数据帧

时间:2017-12-21 12:26:39

标签: pyspark-sql

我已将spark-xml_2.11添加到我的databricks库选项中作为marven坐标

groupId:com.databricks
artifactId:spark-xml_2.11
版本:0.4.1

并尝试将数据加载到DF,如下所示

df = sqlContext.read.format('com.databricks.spark.xml').options(rowTag='catalog').load('smaple.xml')

并收到以下错误。

  

java.lang.ClassNotFoundException:无法找到数据源:com.databricks.spark.xml。请在http://spark.apache.org/third-party-projects.html

找到套餐

0 个答案:

没有答案