应用错误收集

尝试使用pyspark读取databricks中的Xml文件

时间：2019-04-29 11:42:03

标签： xml python-3.x pyspark databricks

我正在尝试从databricks pyspark平台中的Amazon s3读取xml文件。但是它看不懂它。当我使用display（）方法时，输出什么都没有。尽管我正在使用spark-xml库读取它。但这对我没有太大帮助。

我一直在使用databricks 5.2运行时环境（包括Apache Spark 2.4.0，Scala 2.11）。


df = spark.read \
    .format("xml") \
    .option('rootTag', 'breakfast_menu') \
    .option('rowTag', 'food') \
    .load('s3://*****/***/***/**/sample.xml')

0 个答案:

没有答案