我尝试过将这些信息处理成xml的不同方式,没有任何工作。
请帮忙
我在一个标签中有一条多行。我必须将它们转换为适当的xml文档。
这是文字/字符串
<params>
userdata_token=>'abd'
userdata_time=>'12/09/2011'
user_message_address_city=>'Manchester|Harrow|'
user_message_address_postcode=>'M20 7LD||HA0 4BN'
user_message_address_addressee=>'|Pete|'
</params>
xml格式,如
<params>
<userdata>
<token>abd</temp>
<time>12/09/2011</time>
</userdata>
<user>
<message>
<address>
<city>Manchester</city>
<postcode>M20 7LD</postcode>
<addressee></addressee>
</address>
<address>
<city>Harrow</city>
<postcode></postcode>
<addressee>Pete</addressee>
</address>
<address>
<city></city>
<postcode>HA0 4BN</postcode>
<addressee></addressee>
</address>
</message>
<user>
</params>
请有人帮助将字符串拆分为分层元素和相应的值,我希望在XSL和Java中执行此操作,out put是格式良好的xml。我没有输出的xsd,所以我不能使用绑定模式。
答案 0 :(得分:2)
这在XSLT 2.0中非常方便。
为了快速演示(没有完全完成和抛光,但让您了解使用XSLT 2.0进行此类处理),我在几分钟内就提出了这个问题:
<xsl:stylesheet version="2.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:my="my:my">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:variable name="vLines" select=
"tokenize(string(/*), '\s*
\s*')[.]"/>
<xsl:template match="/">
<xsl:sequence select="my:ProcessLines($vLines)"/>
<xsl:text>
</xsl:text>
</xsl:template>
<xsl:function name="my:ProcessLines" as="element()*">
<xsl:param name="pLines" as="xs:string*"/>
<xsl:for-each select="$pLines">
<xsl:sequence select="my:ProcessLine(.)"/>
</xsl:for-each>
</xsl:function>
<xsl:function name="my:ProcessLine" as="element()*">
<xsl:param name="pLine" as="xs:string*"/>
<xsl:variable name="vSides" select="tokenize($pLine, '=>')"/>
<xsl:variable name="vLHS" select="$vSides[1]"/>
<xsl:variable name="vRHS" select=
"substring($vSides[2],2, string-length($vSides[2])-2)"/>
<xsl:variable name="vGendElement" select=
"my:MakeElement(tokenize($vLHS, '_'))"/>
<xsl:sequence select="my:ImplantValues($vGendElement, $vRHS)"/>
</xsl:function>
<xsl:function name="my:MakeElement" >
<xsl:param name="pElemNames" as="xs:string*"/>
<xsl:if test="not(empty($pElemNames))">
<xsl:element name="{$pElemNames[1]}">
<xsl:sequence select=
"my:MakeElement($pElemNames[position() > 1])"/>
</xsl:element>
</xsl:if>
</xsl:function>
<xsl:function name="my:ImplantValues" as="element()*">
<xsl:param name="pTree" as="element()"/>
<xsl:param name="pValues" as="xs:string"/>
<xsl:variable name="vValues" select="tokenize($pValues, '\|')[.]"/>
<xsl:for-each select="$vValues[string-length(normalize-space()) > 0]">
<xsl:apply-templates select="$pTree">
<xsl:with-param name="pValue" select="."/>
</xsl:apply-templates>
</xsl:for-each>
</xsl:function>
<xsl:template match="node()|@*">
<xsl:param name="pValue"/>
<xsl:copy>
<xsl:apply-templates select="node()|@*">
<xsl:with-param name="pValue" select="$pValue"/>
</xsl:apply-templates>
</xsl:copy>
</xsl:template>
<xsl:template match="*[not(*)]">
<xsl:param name="pValue"/>
<xsl:copy>
<xsl:copy-of select="@*"/>
<xsl:copy-of select="$pValue"/>
</xsl:copy>
</xsl:template>
</xsl:stylesheet>
将此转换应用于提供的XML文档(它也可以使用unparsed-text()
函数简单地读取文件中的输入):
<params>
userdata_token=>'abd'
userdata_time=>'12/09/2011'
user_message_address_city=>'Manchester|Harrow|'
user_message_address_postcode=>'M20 7LD||HA0 4BN'
user_message_address_addressee=>'|Pete|'
</params>
结果是:
<userdata>
<token>abd</token>
</userdata>
<userdata>
<time>12/09/2011</time>
</userdata>
<user>
<message>
<address>
<city>Manchester</city>
</address>
</message>
</user>
<user>
<message>
<address>
<city>Harrow</city>
</address>
</message>
</user>
<user>
<message>
<address>
<postcode>M20 7LD</postcode>
</address>
</message>
</user>
<user>
<message>
<address>
<postcode>HA0 4BN</postcode>
</address>
</message>
</user>
<user>
<message>
<address>
<addressee>Pete</addressee>
</address>
</message>
</user>
要完成此操作,只需要添加一些分组 - 我现在准备去上班,所以这可以在今天晚些时候完成。 :)
答案 1 :(得分:1)
在XSLT中完全可以实现.2。看看未解析的文本函数,您可以使用它来读取文件的内容。您可以先调用unparsed-text-available以确保文件可访问,因此如果不是,则XSL转换不会失败。
然后可以将字符串拆分为行和名称/值对。查看tokenize,string-before和string-after函数,了解如何执行此操作。最后,使用&lt; xsl:element&gt;创建所需的输出结构。
答案 2 :(得分:0)
XSL并不关心你的输出是什么;输入必须是格式良好的XML。在这种情况下,您的XML 格式正确,但文本节点包含您需要理解的一些格式化信息。我的建议是不要过于使用XSL。使用正则表达式甚至StringTokenizer进行直接解析将提取您的数据。从那里可以很容易地编写结果文档。