提前感谢您花时间阅读本文。
我有一个看起来像
的输入xml<data>
<row>
<Field1>ABC</Field1>
<Field2>123</Field2>
<tag3>BLAH</tag3>
<tag4>BLAH1</tag4>
</row>
<row>
<Field1>ABC</Field1>
<Field2>789</Field2>
<tag3>BLAH</tag3>
<tag4>BLAH1</tag4>
</row>
<row>
<Field1>DEF</Field1>
<Field2>456</Field2>
<tag3>BLAH3</tag3>
<tag4>BLAH4</tag4>
</row>
<row>
<Field1>456</Field1>
<Field2>XYZ</Field2>
<tag3>BLAH5</tag3>
<tag4>BLAH6</tag4>
</row>
现在我有两个键定义如此
<xsl:key name="Field1Key" match="data/row/Field1/text()" use="."/>
<xsl:key name="Field2Key" match="data/row/Field2/text()" use="."/>
我正在使用键来循环遍历Field1的唯一值,而Field2是
<xsl:for-each select="data/row/Field1/text()[generate-id() = generate-id(key('Field1Key',.)[1])]">
<test>
<xsl:value-of select="."/>
</test>
</xsl:for-each>
<xsl:for-each select="data/row/Field2/text()[generate-id() = generate-id(key('Field2Key',.)[1])]">
<test>
<xsl:value-of select="."/>
</test>
</xsl:for-each>
这给了我一个类似于
的输出<test>ABC</test>
<test>DEF</test>
<test>456</test>
<test>123</test>
<test>789</test>
<test>456</test>
<test>XYZ</test>
所以我的问题是,
如何避免456值出现两次?你能否指出我最有效的方法来实现这一目标,因为我正在处理输入中的大量数据?
非常感谢。
答案 0 :(得分:0)
以这种方式尝试:
XSLT 1.0
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="utf-8" indent="yes"/>
<xsl:key name="Field1or2Key" match="Field1 | Field2" use="."/>
<xsl:template match="/data">
<output>
<xsl:for-each select="(row/Field1 | row/Field2)[generate-id() = generate-id(key('Field1or2Key', .)[1])]">
<test>
<xsl:value-of select="."/>
</test>
</xsl:for-each>
</output>
</xsl:template>
</xsl:stylesheet>
请注意,节点的顺序不同。如果这很重要,请使用xsl:sort
获取所需的订单。
<强>加了:强>
正如Dimitre Novatchev所说,如果你有大量的输入,排序可能不是你的最佳解决方案。我怀疑订单确实不很重要,所以我不会发布替代解决方案(这将更复杂)。
答案 1 :(得分:0)
所以我的问题是,
如何避免456值出现两次?
以下是生成所需结果的简单方法,而不会更改结果元素序列的预期顺序:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:key name="kF1" match="Field1" use="."/>
<xsl:key name="kF2" match="Field2" use="."/>
<xsl:template match="/*">
<xsl:apply-templates select="row/Field1[generate-id() = generate-id(key('kF1',.)[1])]"/>
<xsl:apply-templates select=
"row/Field2[generate-id() = generate-id(key('kF2',.)[1])
and
not(key('kF1', .))]"/>
</xsl:template>
<xsl:template match="Field1 | Field2">
<test><xsl:value-of select="."/></test>
</xsl:template>
</xsl:stylesheet>
在提供的源XML文档上应用此转换时:
<data>
<row>
<Field1>ABC</Field1>
<Field2>123</Field2>
<tag3>BLAH</tag3>
<tag4>BLAH1</tag4>
</row>
<row>
<Field1>ABC</Field1>
<Field2>789</Field2>
<tag3>BLAH</tag3>
<tag4>BLAH1</tag4>
</row>
<row>
<Field1>DEF</Field1>
<Field2>456</Field2>
<tag3>BLAH3</tag3>
<tag4>BLAH4</tag4>
</row>
<row>
<Field1>456</Field1>
<Field2>XYZ</Field2>
<tag3>BLAH5</tag3>
<tag4>BLAH6</tag4>
</row>
</data>
产生了想要的正确结果:
<test>ABC</test>
<test>DEF</test>
<test>456</test>
<test>123</test>
<test>789</test>
<test>XYZ</test>
你能否指出我最有效的方法来实现这一点 我在输入中处理大量数据?
如果按照其他人的建议执行排序,则为O(N*Log(N))
,其中N是源XML文档中元素Field1
和Field2
的唯一字符串值的数量。
上述解决方案不进行任何排序,其他not(key('kF1', .))]
仅为O(M)
,其中M是Field2
元素的唯一字符串值的数量源XML文档。
因此,此解决方案比使用排序重新建立原始订单更有效 - 在输入&#34;中大量数据的情况下非常有效。