我正在尝试从databricks pyspark平台中的Amazon s3读取xml文件。但是它看不懂它。当我使用display()方法时,输出什么都没有。尽管我正在使用spark-xml库读取它。但这对我没有太大帮助。
我一直在使用databricks 5.2运行时环境(包括Apache Spark 2.4.0,Scala 2.11)。
df = spark.read \
.format("xml") \
.option('rootTag', 'breakfast_menu') \
.option('rowTag', 'food') \
.load('s3://*****/***/***/**/sample.xml')