尝试使用pyspark读取databricks中的Xml文件

时间:2019-04-29 11:42:03

标签: xml python-3.x pyspark databricks

我正在尝试从databricks pyspark平台中的Amazon s3读取xml文件。但是它看不懂它。当我使用display()方法时,输出什么都没有。尽管我正在使用spark-xml库读取它。但这对我没有太大帮助。

我一直在使用databricks 5.2运行时环境(包括Apache Spark 2.4.0,Scala 2.11)。


df = spark.read \
    .format("xml") \
    .option('rootTag', 'breakfast_menu') \
    .option('rowTag', 'food') \
    .load('s3://*****/***/***/**/sample.xml')

0 个答案:

没有答案