带有正则表达式的xslt 2.0 unparsed-text

时间:2013-06-17 10:57:17

标签: xml regex xslt-2.0 plaintext

我有明文: 输入文字

ExternalEvent(GpiIn2: LOW->HI) - AirAction(Play)
AirLog
<log date="2012-07-22" Audio="123.wav" />
AirLog

当我使用代码xslt 2.0 transform:

<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>

<xsl:variable name="vText" select=
 "replace(unparsed-text('file:///c:/123.log'),'\r','')"/>

 <xsl:template match="/">
  <document>
      <xsl:analyze-string select="$vText" regex="'\&lt;'">
         <xsl:non-matching-substring><xsl:sequence select="."/></xsl:non-matching-substring>
      </xsl:analyze-string>
  </document>
 </xsl:template>
</xsl:stylesheet>

我得到了xml:

<document>
    ExternalEvent(GpiIn2: LOW-&gt;HI) - AirAction(Play)
    AirLog
    &lt;log date="2012-07-22" Audio="123.wav" /&gt;
    AirLog
</document>

任何人都可以告诉我,我需要添加到regexp中以获得格式良好的XML,其中包括:

<document>
      <log date="2012-07-22" Audio="123.wav" >
</document>

1 个答案:

答案 0 :(得分:0)

使用像XmlPrime或Saxon这样的XSLT 2.0处理器,它已经支持W3C XPath 3.0中的函数,如parse-xml-fragment,你可以简单地执行

<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:output indent="yes"/>

<xsl:param name="url1" select="'file:///c:/123.log'"/>

<xsl:template match="/">
  <document>
    <xsl:copy-of select="parse-xml-fragment(unparsed-text($url1))//log"/>
  </document>
</xsl:template>

</xsl:stylesheet>