我正在将一些生成的DocBook xml(来自Doxygen)转换为我的公司xml,它实际上是DocBook的一个子集。有一个如下的para元素:
<para>some text.....
<literallayout>
</literallayout>
more text....
<table>
...
</table>
even more text
<table>...</table>
<literallayout>text also look here</literlayout>
more text <link xlink:href="http://someurl.com">
</para>
由于我们的docbook子集不喜欢para中的块元素,比如table或figure,我想解析这个元素,并在这些文本片段周围放置新的para元素,这样我就会有这样的东西:
<para>some text.....
</para>
<literallayout>
</literallayout>
<para>
more text....
</para>
<table>
...
</table>
<para>
even more text
</para>
<table>...</table>
<literallayout>text also look here </literlayout>
<para> more text</para>
<para> <link xlink:href="http://someurl.com"></para>
以前,我以为我永远不会看到这么复杂的东西,我把桌子放在这样的para元素之外:
<xsl:when test="( child::figure | child::table ) and (./text())">
<Para>
<xsl:value-of select="./text()"/>
</Para>
<xsl:apply-templates select="*"/>
</xsl:when>
但最终只捕获了第一个文本节点,并弄乱了其他内容。
任何人都可以提出建议,希望这是一种优雅的方式来解决这个问题,如果para元素是如此混乱?
谢谢,
拉斯
更新:我忽略了引入一个角落案例。我上面编辑了原始源代码检查链接元素。当前的解决方案从源中删除了包含的para元素。
答案 0 :(得分:2)
您可以使用
之类的内容将para
元素中的每个文本节点转换为自己的para
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:template match="@*|node()">
<xsl:copy><xsl:apply-templates select="@*|node()" /></xsl:copy>
</xsl:template>
<xsl:template match="para">
<xsl:apply-templates />
</xsl:template>
<xsl:template match="para/text()">
<para><xsl:value-of select="." /></para>
</xsl:template>
</xsl:stylesheet>
但如果您只想在某些某些子元素而不是其他元素上分解,那么这可能还不够。
答案 1 :(得分:0)
我必须更正你的一些XML示例,以便它的格式正确。但是以下内容:
<xsl:template match="para">
<xsl:for-each select="node()">
<xsl:choose>
<xsl:when test="self::text() and normalize-space(.)!=''">
<xsl:element name="para">
<xsl:apply-templates select="."/>
</xsl:element>
</xsl:when>
<xsl:otherwise>
<xsl:apply-templates select="."/>
</xsl:otherwise>
</xsl:choose>
</xsl:for-each>
</xsl:template>
<xsl:template match="text()">
<xsl:copy-of select="."/>
</xsl:template>
<xsl:template match="literallayout">
<xsl:copy-of select="."/>
</xsl:template>
<xsl:template match="table">
<xsl:copy-of select="."/>
</xsl:template>
输出:
<para>some text..... </para>
<literallayout>
</literallayout>
<para> more text.... </para>
<table> ... </table>
<para> even more text </para>
<table>...</table>
<literallayout>text also look here <link xlink:href="http://someurl.com"/></literallayout>
<para> more text. </para>
我希望有所帮助。
答案 2 :(得分:0)
我应该使用这些模板:
<xsl:template match="para">
<xsl:apply-templates select="node()" mode="flat" />
</xsl:template>
<xsl:template match="*" mode="flat">
<xsl:copy-of select="." />
</xsl:template>
<xsl:template match="text()[normalize-space()!='']" mode="flat">
<para>
<xsl:value-of select="."/>
</para>
</xsl:template>
<xsl:template match="text()[normalize-space()='']" mode="flat" />