使用Spark数据框更改XML模式

时间:2018-07-02 15:35:07

标签: apache-spark pyspark apache-spark-sql databricks

我有一个具有以下架构的xml

<Entries>
    <row>
        <item1>val</item1>
        <item2>val</item2>
    </row>
    <row>
        <item1>val</item1>
        <item2>val</item2>
    </row>
</Entries>

并且我想使用数据框更改其架构,如下所示

<Entries>
    <row item1="val" item2="val" />
    <row item1="val" item2="val" />
</Entries>

反正有使用Spark数据框实现此目标的方法。

我已经尝试了dataframe的schema(customSchema)选项,但是没有用。

0 个答案:

没有答案