标签: python dataframe pyspark
我尝试使用pyspark read,但是由于无法获取根标签的详细信息而无法正常工作。导致部分输出。
spark.read.format('xml').option('rowTag','rowtagname').option('valueTag','valuetagname').load(vlSrcFile)
具有所有xml嵌套元素以及根元素作为数据框列的数据框