编写XSLT将XML片段转换为XMLStreamWriter

时间:2018-04-13 09:05:40

标签: java xslt namespaces jaxb saxon

我遇到了以下问题:

  • 大输出文件(zip),包含一个xml文档(" FeatureCollection")
  • 相对较小的xml片段
  • 每个片段都需要写成" featureMember" XSLT转换后的XMLStream
  • 仅在" FeatureCollection"上的命名空间定义(根)标签。

现在,我通过使用单独的字节流来解析片段来实现这一点。我还包装XMLStream以避免XSLT转换器(Saxon)打开/关闭文档或关闭流。

然而,我觉得解决方案太复杂了。应该可以将JAXB上下文作为源(没有中间字节流)。请参阅code-snippet:

        try {
            XMLStreamWriterWrapper writer = getWriter( xmlFile );
            for ( Map.Entry<String, String> entry : prefixMapper.getNamespaces().entrySet() ) {
                writer.setPrefix( entry.getValue(), entry.getKey() );
            }

            writer.getWrapperWriter().writeStartDocument();
            writer.writeStartElement( GML_URI, "FeatureCollection" );

            for ( Map.Entry<String, String> entry : prefixMapper.getNamespaces().entrySet() ) {
                writer.getWrapperWriter().writeNamespace( entry.getValue(), entry.getKey() );
            }

            while ( dtoIterator.hasNext() ) {
                writer.writeStartElement( GML_URI, "featureMember" );
                D dto = dtoIterator.next();
                hideAttributes( dto );

                J jaxb = transformToJaxb( dto );

                Source untransformed = new JAXBSource( jaxbContext, getRootElement( jaxb ) );
                getTransformer().transform( untransformed, new StAXResult( writer) );
                writer.writeEndElement();
            }

            writer.writeEndElement();
            writer.getWrapperWriter().writeEndDocument();
            writer.getWrapperWriter().flush();
            writer.getWrapperWriter().close();
        }
        catch ( IOException | JAXBException | TransformerException | XMLStreamException e ) {
            LOG.error( e );
            throw new IllegalArgumentException( e );
        }

private XMLStreamWriterWrapper getWriter( File xmlFile ) throws XMLStreamException, FileNotFoundException, IOException {
    XMLOutputFactory xof = XMLOutputFactory.newFactory();
    xof.setProperty( XMLOutputFactory.IS_REPAIRING_NAMESPACES, Boolean.TRUE );

    XMLStreamWriter writer = xof.createXMLStreamWriter( new BufferedOutputStream( new FileOutputStream( xmlFile ) ) );

    return new XMLStreamWriterWrapper( writer );
}           

预期结果(来自非优化解决方案):

<?xml version="1.0" ?><gml:FeatureCollection xmlns:gml="http://www.opengis.net/gml/3.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:brocom="http://www.broservices.nl/xsd/brocommon/3.0" xmlns:bro="http://www.pdok.nl/bro">
<gml:featureMember>
    <bro:Characteristics gml:id="BRO_id_1">
        <brocom:broId>id_1</brocom:broId>
    </bro:Characteristics>
</gml:featureMember>
<gml:featureMember>
    <bro:Characteristics gml:id="BRO_id_2">
        <brocom:broId>id_2</brocom:broId>
    </bro:Characteristics>
</gml:featureMember>

然而,结果(来自上面的代码snippit)是:

<?xml version="1.0" ?><gml:FeatureCollection xmlns:gml="http://www.opengis.net/gml/3.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:brocom="http://www.broservices.nl/xsd/brocommon/3.0" xmlns:bro="http://www.pdok.nl/bro">
<gml:featureMember>
    <bro:Characteristics gml:id="BRO_id_1">
        <broId xmlns="http://www.broservices.nl/xsd/brocommon/3.0">id_1</broId>
    </bro:Characteristics>
</gml:featureMember>
<gml:featureMember>
    <bro:Characteristics gml:id="BRO_id_2">
        <broId xmlns="http://www.broservices.nl/xsd/brocommon/3.0">id_2</broId>
    </bro:Characteristics>
</gml:featureMember>

问题:

  1. XMLStreamWriter似乎忽略了属性IS_REPAIRING_NAMESPACES。有什么问题?
  2. 我可以优化Saxon转换器,使其在部分xml上运行。 Ergo:我真的需要包装XMLOutputStream,以便转换器不写一个打开/关闭文档或完全关闭流吗?
  3. 我是否正确定义了名称空间(使用setPrefix和writeNameSpace)。
  4. 使用JAXB marshaller时,我可以在marshaller上设置属性,如:JAXB_FORMATTED_OUTPUT,JAXB_FRAGMENT。我能这样做也是这个解决方案吗?

1 个答案:

答案 0 :(得分:1)

请注意,您可以使用Saxon实现的XMLStreamWriter代替您正在使用的实现(Processor.newSerializer().getXMLStreamWriter())。这可能会给你更多的控制权,也许可以解决命名空间问题。

您可以尝试提供new StaxResult(writer),而不是提供transform()作为new net.sf.saxon.stax.ReceiverToXMLStreamWriter(writer)的第二个参数,然后您可以将ReceiverToXMLStreamWriter作为子类,以便startDocument() }和endDocument()调用什么都不做。

关于命名空间的XMLStreamWriter处理,我担心API规范非常模糊。我发现咨询http://veithen.github.io/2009/11/01/understanding-stax.html有帮助,尽管它没有官方地位。我无法保证Saxon解释是API的作者所期望的(没有参考实现或测试套件)。