我有一种情况,我正在从蜂巢表中读取数据并创建一个spark数据框。我想从数据帧的输出生成xml字符串并将其保存在新的数据帧中(作为xml字符串),而不是将其写入HDFS中的文件以创建xml。请告诉我是否可以使用databricks spark-xml来完成。
答案 0 :(得分:1)
您不能使用spark-xml库执行此操作,但是可以重用其中的writeout部分来为XmlRdd创建自己的解决方案:https://github.com/databricks/spark-xml/blob/master/src/main/scala/com/databricks/spark/xml/util/XmlFile.scala
您完全可以在第80行中找到这个。