解析XML时,可以在记录中包括根元素中的元数据吗?

时间:2019-09-08 17:37:41

标签: xml apache-beam

我正在使用Wikipedia XML,并且Wiki的语言作为属性被编码在父元素中

<mediawiki lang="en">
  ....pages....
</mediawiki>

在Java或Scala中使用XmlIO解析记录元素都没有问题,但是我找不到任何文档或指南来提取该lang属性。

我一直在寻找通过第二个XmlIO.Read()单独解析属性的方法,但是XmlIO文档中的Root元素的属性绝对没有什么。

我的页面对象当前为:

@XmlRootElement(name = "page")
@XmlAccessorType(XmlAccessType.FIELD)
case class WikiPage(id: Int, ns: Int, title: String, @XmlElement(name="revision") revision: Array[WikiRevision]) {
  def this() = this(0, 0, "", new Array[WikiRevision](0))
}

我现在不关心语言属性的去向(理想情况下,我要么将其合并为页面上的一个属性,要么将其放在顶层页面输出时对象所在的对象),我只希望它在输出数据上存在 somewhere

0 个答案:

没有答案