如何将XML声明添加到使用Spark XML数据块编写的XML文件中

时间:2018-07-02 14:16:14

标签: xml scala apache-spark

我想在Spark中使用Scala从CSV / Dataframe创建带有XML声明的XML文件。我正在使用Databricks spark-XML库将DataFrame转换为XML格式。

示例代码

spark.sql("Select 1 as id")..write \
.format('com.databricks.spark.xml') \
.options(rowTag='row', rootTag='rows') \
.save('Sample.xml')

数据框

+---+
| id|
+---+
|  1|
+---+

实际输出

<rows>
<row>
<id>1<id>
</row>
</rows>

预期产量

<?xml version="1.0" encoding"UTF-8">
    <rows>
    <row>
    <id>1<id>
    </row>
    </rows>

有人可以帮助在由数据块XML生成的XML中添加版本和编码元素吗?

预先感谢

0 个答案:

没有答案