xslt在DocBook para元素中展平子元素

时间:2013-11-27 16:24:31

标签: xml xslt docbook

我正在将一些生成的DocBook xml(来自Doxygen)转换为我的公司xml,它实际上是DocBook的一个子集。有一个如下的para元素:

<para>some text.....
   <literallayout>
   </literallayout>
 more text....
 <table>
   ...
 </table>
 even more text
<table>...</table>
<literallayout>text also look here</literlayout>
more text <link xlink:href="http://someurl.com">
</para>

由于我们的docbook子集不喜欢para中的块元素,比如table或figure,我想解析这个元素,并在这些文本片段周围放置新的para元素,这样我就会有这样的东西:

<para>some text.....
</para>
   <literallayout>
   </literallayout>
 <para>
  more text....
 </para>
 <table>
   ...
 </table>
 <para>
 even more text
 </para>
<table>...</table>
<literallayout>text also look here </literlayout>
 <para> more text</para>
 <para> <link xlink:href="http://someurl.com"></para>

以前,我以为我永远不会看到这么复杂的东西,我把桌子放在这样的para元素之外:

<xsl:when test="( child::figure | child::table ) and (./text())">
    <Para>
        <xsl:value-of select="./text()"/>
    </Para>
    <xsl:apply-templates select="*"/>
</xsl:when>

但最终只捕获了第一个文本节点,并弄乱了其他内容。

任何人都可以提出建议,希望这是一种优雅的方式来解决这个问题,如果para元素是如此混乱?

谢谢,

拉​​斯

更新:我忽略了引入一个角落案例。我上面编辑了原始源代码检查链接元素。当前的解决方案从源中删除了包含的para元素。

3 个答案:

答案 0 :(得分:2)

您可以使用

之类的内容将para元素中的每个文本节点转换为自己的para
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
  <xsl:template match="@*|node()">
    <xsl:copy><xsl:apply-templates select="@*|node()" /></xsl:copy>
  </xsl:template>

  <xsl:template match="para">
    <xsl:apply-templates />
  </xsl:template>

  <xsl:template match="para/text()">
    <para><xsl:value-of select="." /></para>
  </xsl:template>
</xsl:stylesheet>

但如果您只想在某些某些子元素而不是其他元素上分解,那么这可能还不够。

答案 1 :(得分:0)

我必须更正你的一些XML示例,以便它的格式正确。但是以下内容:

    <xsl:template match="para">
        <xsl:for-each select="node()">
            <xsl:choose>
                <xsl:when test="self::text() and normalize-space(.)!=''">
                    <xsl:element name="para">
                        <xsl:apply-templates select="."/>
                    </xsl:element>
                </xsl:when>
                <xsl:otherwise>
                    <xsl:apply-templates select="."/>
                </xsl:otherwise>
            </xsl:choose>
        </xsl:for-each>
    </xsl:template>
    <xsl:template match="text()">
        <xsl:copy-of select="."/>
    </xsl:template>
    <xsl:template match="literallayout">
        <xsl:copy-of select="."/>
    </xsl:template>
    <xsl:template match="table">
        <xsl:copy-of select="."/>
    </xsl:template>

输出:

<para>some text..... </para>
<literallayout>
</literallayout>
<para> more text.... </para>
<table> ... </table>
<para> even more text </para>
<table>...</table>
<literallayout>text also look here <link xlink:href="http://someurl.com"/></literallayout>
<para> more text. </para>

我希望有所帮助。

答案 2 :(得分:0)

我应该使用这些模板:

<xsl:template match="para">
    <xsl:apply-templates select="node()" mode="flat" />
</xsl:template>

<xsl:template match="*" mode="flat">
    <xsl:copy-of select="." />
</xsl:template>

<xsl:template match="text()[normalize-space()!='']" mode="flat">
    <para>
        <xsl:value-of select="."/>
    </para>
</xsl:template> 

<xsl:template match="text()[normalize-space()='']" mode="flat" />