如何将纯文本转换为xsl

时间:2011-10-05 09:35:33

标签: xml xslt

我尝试过将这些信息处理成xml的不同方式,没有任何工作。

请帮忙

我在一个标签中有一条多行。我必须将它们转换为适当的xml文档。

这是文字/字符串

  <params>
         userdata_token=>'abd'
         userdata_time=>'12/09/2011'
         user_message_address_city=>'Manchester|Harrow|'
         user_message_address_postcode=>'M20 7LD||HA0 4BN'
         user_message_address_addressee=>'|Pete|'
  </params>

xml格式,如

  <params>
    <userdata>
      <token>abd</temp>
      <time>12/09/2011</time>
    </userdata>
    <user>
      <message>
         <address>
           <city>Manchester</city>
           <postcode>M20 7LD</postcode>
           <addressee></addressee>
         </address>     
         <address>
           <city>Harrow</city>
           <postcode></postcode>
           <addressee>Pete</addressee>
         </address>  
         <address>
           <city></city>
           <postcode>HA0 4BN</postcode>
           <addressee></addressee>
         </address>  
       </message>
      <user>    
  </params>

请有人帮助将字符串拆分为分层元素和相应的值,我希望在XSL和Java中执行此操作,out put是格式良好的xml。我没有输出的xsd,所以我不能使用绑定模式。

3 个答案:

答案 0 :(得分:2)

这在XSLT 2.0中非常方便

为了快速演示(没有完全完成和抛光,但让您了解使用XSLT 2.0进行此类处理),我在几分钟内就提出了这个问题:

<xsl:stylesheet version="2.0"
        xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
        xmlns:xs="http://www.w3.org/2001/XMLSchema"
        xmlns:my="my:my">
        <xsl:output omit-xml-declaration="yes" indent="yes"/>

        <xsl:variable name="vLines" select=
             "tokenize(string(/*), '\s*&#xA;\s*')[.]"/>

     <xsl:template match="/">
         <xsl:sequence select="my:ProcessLines($vLines)"/>
          <xsl:text>&#xA;</xsl:text>
     </xsl:template>

     <xsl:function name="my:ProcessLines" as="element()*">
      <xsl:param name="pLines" as="xs:string*"/>

      <xsl:for-each select="$pLines">
        <xsl:sequence select="my:ProcessLine(.)"/>
      </xsl:for-each>
     </xsl:function>

     <xsl:function name="my:ProcessLine" as="element()*">
      <xsl:param name="pLine" as="xs:string*"/>

      <xsl:variable name="vSides" select="tokenize($pLine, '=>')"/>

      <xsl:variable name="vLHS" select="$vSides[1]"/>
      <xsl:variable name="vRHS" select=
          "substring($vSides[2],2, string-length($vSides[2])-2)"/>

      <xsl:variable name="vGendElement" select=
           "my:MakeElement(tokenize($vLHS, '_'))"/>

      <xsl:sequence select="my:ImplantValues($vGendElement, $vRHS)"/>
     </xsl:function>

     <xsl:function name="my:MakeElement" >
      <xsl:param name="pElemNames" as="xs:string*"/>

       <xsl:if test="not(empty($pElemNames))">
         <xsl:element name="{$pElemNames[1]}">
           <xsl:sequence select=
            "my:MakeElement($pElemNames[position() > 1])"/>
         </xsl:element>
       </xsl:if>
     </xsl:function>

     <xsl:function name="my:ImplantValues" as="element()*">
       <xsl:param name="pTree" as="element()"/>
       <xsl:param name="pValues" as="xs:string"/>

       <xsl:variable name="vValues" select="tokenize($pValues, '\|')[.]"/>

       <xsl:for-each select="$vValues[string-length(normalize-space()) > 0]">
         <xsl:apply-templates select="$pTree">
          <xsl:with-param name="pValue" select="."/>
         </xsl:apply-templates>
       </xsl:for-each>
     </xsl:function>

     <xsl:template match="node()|@*">
       <xsl:param name="pValue"/>
       <xsl:copy>
         <xsl:apply-templates select="node()|@*">
           <xsl:with-param name="pValue" select="$pValue"/>
         </xsl:apply-templates>
       </xsl:copy>
     </xsl:template>

     <xsl:template match="*[not(*)]">
       <xsl:param name="pValue"/>

       <xsl:copy>
         <xsl:copy-of select="@*"/>
         <xsl:copy-of select="$pValue"/>
       </xsl:copy>
     </xsl:template>
</xsl:stylesheet>

将此转换应用于提供的XML文档(它也可以使用unparsed-text()函数简单地读取文件中的输入):

<params>
  userdata_token=>'abd'
  userdata_time=>'12/09/2011'
  user_message_address_city=>'Manchester|Harrow|'
  user_message_address_postcode=>'M20 7LD||HA0 4BN'
  user_message_address_addressee=>'|Pete|'
</params>

结果是

<userdata>
   <token>abd</token>
</userdata>
<userdata>
   <time>12/09/2011</time>
</userdata>
<user>
   <message>
      <address>
         <city>Manchester</city>
      </address>
   </message>
</user>
<user>
   <message>
      <address>
         <city>Harrow</city>
      </address>
   </message>
</user>
<user>
   <message>
      <address>
         <postcode>M20 7LD</postcode>
      </address>
   </message>
</user>
<user>
   <message>
      <address>
         <postcode>HA0 4BN</postcode>
      </address>
   </message>
</user>
<user>
   <message>
      <address>
         <addressee>Pete</addressee>
      </address>
   </message>
</user>

要完成此操作,只需要添加一些分组 - 我现在准备去上班,所以这可以在今天晚些时候完成。 :)

答案 1 :(得分:1)

在XSLT中完全可以实现.2。看看未解析的文本函数,您可以使用它来读取文件的内容。您可以先调用unparsed-text-available以确保文件可访问,因此如果不是,则XSL转换不会失败。

然后可以将字符串拆分为行和名称/值对。查看tokenize,string-before和string-after函数,了解如何执行此操作。最后,使用&lt; xsl:element&gt;创建所需的输出结构。

答案 2 :(得分:0)

XSL并不关心你的输出是什么;输入必须是格式良好的XML。在这种情况下,您的XML 格式正确,但文本节点包含您需要理解的一些格式化信息。我的建议是不要过于使用XSL。使用正则表达式甚至StringTokenizer进行直接解析将提取您的数据。从那里可以很容易地编写结果文档。