JAXB:有没有办法只解组XML中的特定路径?

时间:2015-09-25 02:42:15

标签: java xml spring jaxb spring-oxm

我有一个XSD,它定义了几种复杂类型的层次结构(每一种都是另一种的孩子)。

例如:

<xs:schema version="1.3"
  targetNamespace="https://www.domain.com/schema/reports/export/1.0"
  xmlns:tns="https://www.domain.com/schema/reports/export/1.0"
  xmlns:xs="http://www.w3.org/2001/XMLSchema"
  elementFormDefault="qualified">

<xs:element name="detailedreport">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="severity" minOccurs="6" maxOccurs="6" type="tns:SeverityType" />
    </xs:sequence>
    </xs:complexType>
</xs:element>

<xs:complexType name="SeverityType">
  <xs:sequence>
    <xs:element name="category" minOccurs="0" maxOccurs="unbounded" type="tns:CategoryType"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="CategoryType">
  <xs:sequence>
    <xs:element name="cwe" maxOccurs="unbounded" type="tns:CweType"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="CweType">
  <xs:sequence>
    <xs:element name="staticflaws" type="tns:FlawListType" minOccurs="0"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="FlawListType">
  <xs:sequence>
    <xs:element name="flaw" minOccurs="0" maxOccurs="unbounded" type="tns:FlawType" />
  </xs:sequence>
</xs:complexType>

<xs:complexType name="FlawType">
  <xs:sequence>
    <xs:element name="mitigations" minOccurs="0" maxOccurs="1" type="tns:MitigationListType" />
    <xs:element name="exploit_desc" type="tns:LongTextType" minOccurs="0" maxOccurs="1"/>
  </xs:sequence>
</xs:complexType>


<xs:complexType name="MitigationListType">
  <xs:sequence>
    <xs:element name="mitigation" minOccurs="0" maxOccurs="unbounded" type="tns:MitigationType"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="MitigationType">
  <xs:attribute name="action" type="xs:string" use="required"/>
  <xs:attribute name="description" type="xs:string" use="required"/>
  <xs:attribute name="user" type="xs:string" use="required"/>
  <xs:attribute name="date" type="xs:string" use="required"/>
</xs:complexType>

</xs:schema>

我希望只将complexType FlawType导入到列表中。我想我可以使用Apache Digester来做这个但是想知道是否有某种方法可以用JAXB做到这一点。直接解组到detailedreport对象,然后使用循环来提取FlawType是可行的,但似乎需要做很多额外的工作。

从本质上讲,我希望能够提出一个类似的解决方案:

   String xml = FileUtils.readFileToString( XML_File );
   unmarshaller = JAXBContext.createUnmarshaller();
   // only unmarhsal nodes of FlawType.class from the xml file.
   List<FlawType> flawTypes = unmarshaller.unmarshal( xml, FlawType.class );

我可能会将整个XML文件加载到DOM对象中,然后使用像XPath这样的东西来定位所有单独的FlawType节点,对于每个节点,使用Unmarshaller为每个节点执行此操作,但没有&# 39;不知道是否有更简单的方法。我认为我也可以使用某种形式的SAX Parser(我从未使用过它们),但希望能有一些更直接的东西。

我实际上使用带有spring-oxm软件包的Spring 4框架为我处理了很多JAXB的工作,因此很想找到一个易于理解和维护的简单解决方案。使用像Digester这样的东西只会为我的堆栈添加更多技术,我宁愿避免使用。

使用JAXB有一种简单的方法吗,或者这超出了JAXB的范围?

1 个答案:

答案 0 :(得分:1)

我设法找到以下作为解决方案,但不要认为它是最可能的:

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder(); 
Document doc = db.parse(IOUtils.toInputStream(xml));
NodeList nodeList = doc.getElementsByTagName("cwe");

JAXBContext jc = JAXBContext.newInstance( CweType.class );
Unmarshaller u = jc.createUnmarshaller();

List<CweType> cwes = new ArrayList<>();
for( int i = 0; i < nodeList.getLength(); i++ )
    cwes.add( u.unmarshal(nodeList.item(i),  CweType.class);

我希望有点整洁。对于初学者,我不喜欢我必须手动搜索名为cwe的元素的想法。我至少希望能够从生成的CweType类或CategoryType类中获取元素名称,但我能看到的唯一方法就是反射。这是唯一的方法吗?