如何使用pyspark解析xml文件并将其转换为数据框?

时间:2019-05-31 09:28:25

标签: python dataframe pyspark

我尝试使用pyspark read,但是由于无法获取根标签的详细信息而无法正常工作。导致部分输出。

spark.read.format('xml').option('rowTag','rowtagname').option('valueTag','valuetagname').load(vlSrcFile)

具有所有xml嵌套元素以及根元素作为数据框列的数据框

0 个答案:

没有答案