我有一个vrey大xml文件。我尝试生成一个leigther xml文件,用它来用SSIS提取数据。
我的文件包含几个案例。我把每个案例here
我提取了4个简化的案例
<ICECAT-interface xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="http://data.icecat.biz/xsd/files.index.xsd">
<files.index Generated="20150916022750">
<file path="export/freexml.int/FR/29799266.xml" Product_ID="29799266" Updated="20150915223003" Quality="ICECAT" Supplier_id="25" Prod_ID="89811499" Catid="827" On_Market="0" Model_Name="AmazonLED" Product_View="0" HighPic="http://images.icecat.biz/img/gallery/29799266_6440.jpg" HighPicSize="189800" HighPicWidth="2000" HighPicHeight="2000" Date_Added="20150915000000"></file>
<file path="export/freexml.int/FR/4312841.xml" Product_ID="4312841" Updated="20150523100119" Quality="ICECAT" Supplier_id="30" Prod_ID="003R92156" Catid="197" On_Market="1" Model_Name="3640" Product_View="32767" HighPic="http://images.icecat.biz/img/norm/high/4312841-1574.jpg" HighPicSize="289900" HighPicWidth="1552" HighPicHeight="1200" Date_Added="20100306000000">
<M_Prod_ID>DOCUMATE 3640</M_Prod_ID>
<M_Prod_ID>003R92156</M_Prod_ID>
</file>
<file path="export/freexml.int/FR/26064804.xml" Product_ID="26064804" Updated="20150827060248" Quality="ICECAT" Supplier_id="11077" Prod_ID="30097568" Catid="2943" On_Market="0" Model_Name="Color Show 110 Urban Coral" Product_View="2819" HighPic="http://images.icecat.biz/img/norm/high/26064804-6070.jpg" HighPicSize="34989" HighPicWidth="400" HighPicHeight="355" Date_Added="20150127000000">
<M_Prod_ID>0000030097568</M_Prod_ID>
<M_Prod_ID>0000030097568</M_Prod_ID>
</file>
<file path="export/freexml.int/FR/4312841.xml" Product_ID="4312841" Updated="20150523100119" Quality="ICECAT" Supplier_id="30" Prod_ID="dfqsdfqfq6" Catid="197" On_Market="1" Model_Name="3640" Product_View="32767" HighPic="http://images.icecat.biz/img/norm/high/4312841-1574.jpg" HighPicSize="289900" HighPicWidth="1552" HighPicHeight="1200" Date_Added="20100306000000">
<M_Prod_ID Supplier_id="670" Supplier_name="Visioneer">dfqsdfqfq6</M_Prod_ID>
</file>
</files.index>
</ICECAT-interface>
我的xslt
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" encoding="UTF-8" indent="yes"/>
<xsl:template match="/">
<xsl:apply-templates/>
</xsl:template>
<xsl:template match="ICECAT-interface">
<xsl:apply-templates select="files.index"/>
</xsl:template>
<xsl:template match="files.index">
<xsl:element name="files">
<xsl:attribute name="Generated">
<xsl:value-of select="@Generated"/>
</xsl:attribute>
<xsl:apply-templates select="file"/>
</xsl:element>
</xsl:template>
<xsl:template match="file">
<xsl:element name="file">
<xsl:attribute name="path">
<xsl:value-of select="@path"/>
</xsl:attribute>
<xsl:attribute name="Prod_ID">
<xsl:value-of select="@Prod_ID"/>
</xsl:attribute>
<xsl:attribute name="Supplier_id">
<xsl:value-of select="@Supplier_id"/>
</xsl:attribute>
<xsl:attribute name="Catid">
<xsl:value-of select="@Catid"/>
</xsl:attribute>
<xsl:attribute name="Updated">
<xsl:value-of select="@Updated"/>
</xsl:attribute>
<xsl:attribute name="Quality">
<xsl:value-of select="@Quality"/>
</xsl:attribute>
</xsl:element>
<xsl:apply-templates select="M_Prod_ID"/>
</xsl:template>
<xsl:template match="M_Prod_ID" />
<xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)]">
<file path="{../@path}" Prod_ID="{.}" Catid="../@Catid" Updated="../@Updated" Quality="../@Quality">
<xsl:attribute name="Supplier_id">
<xsl:choose>
<xsl:when test="@Supplier_id">
<xsl:value-of select="@Supplier_id"/>
</xsl:when>
<xsl:otherwise>
<xsl:value-of select="../@Supplier_id"/>
</xsl:otherwise>
</xsl:choose>
</xsl:attribute>
</file>
</xsl:template>
</xsl:stylesheet>
结果
<files Generated="20150916022750">
<file path="export/freexml.int/FR/29799266.xml"
Prod_ID="89811499"
Supplier_id="25"
Catid="827"
Updated="20150915223003"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="003R92156"
Supplier_id="30"
Catid="197"
Updated="20150523100119"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="DOCUMATE 3640"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="30"/>
<file path="export/freexml.int/FR/26064804.xml"
Prod_ID="30097568"
Supplier_id="11077"
Catid="2943"
Updated="20150827060248"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/26064804.xml"
Prod_ID="0000030097568"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="11077"/>
<file path="export/freexml.int/FR/26064804.xml"
Prod_ID="0000030097568"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="11077"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="dfqsdfqfq6"
Supplier_id="30"
Catid="197"
Updated="20150523100119"
Quality="ICECAT"/>
</files>
2问题是
<file path="export/freexml.int/FR/26064804.xml"
Prod_ID="0000030097568"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="11077"/>
重复两次。
,最后一行与Supplier_Id = 670
不重复在先前的问题。 @Abel说使用
<xsl:template match="M_Prod_ID[text() = following-sibling::M_Prod_ID/text()]">
结果here
然后文件节点重复两次就好了,但我丢失了文件节点
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="DOCUMATE 3640"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="30"/>
我如何混合两种解决方案? 其他人说使用分组。但我不知道它是如何运行的。
我想要
<files Generated="20150916022750">
<file path="export/freexml.int/FR/29799266.xml"
Prod_ID="89811499"
Supplier_id="25"
Catid="827"
Updated="20150915223003"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="003R92156"
Supplier_id="30"
Catid="197"
Updated="20150523100119"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="DOCUMATE 3640"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="30"/>
<file path="export/freexml.int/FR/26064804.xml"
Prod_ID="30097568"
Supplier_id="11077"
Catid="2943"
Updated="20150827060248"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/26064804.xml"
Prod_ID="0000030097568"
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
Supplier_id="11077"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="dfqsdfqfq6"
Supplier_id="30"
Catid="197"
Updated="20150523100119"
Quality="ICECAT"/>
<file path="export/freexml.int/FR/4312841.xml"
Prod_ID="dfqsdfqfq6"
Supplier_id="670"
Catid="197"
Updated="20150523100119"
Quality="ICECAT"/>
</files>
答案 0 :(得分:1)
现在很清楚您想要什么,我认为解决方案比您第一次发布问题时看起来更容易。非常感谢您展示相关代码。
此代码
<xsl:template match="M_Prod_ID[text() = following-sibling::M_Prod_ID/text()]">
正在测试两个兄弟M_Prod_ID
之间的重复项,但它没有假设这些重复项也可能出现一次。
XSLT 1.0中的解决方案并不像人们想象的那么简单,它显示了迈克尔建议选择Muenchian分组的原因。这是非Muenchian方式:
<xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)][following-sibling::M_Prod_ID][text() = following-sibling::M_Prod_ID/text()]" priority="5"/>
这里它适用于样式表的简化版本:
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output method="xml" encoding="UTF-8" indent="yes"/>
<xsl:template match="/">
<xsl:apply-templates/>
</xsl:template>
<xsl:template match="ICECAT-interface">
<xsl:apply-templates select="files.index"/>
</xsl:template>
<xsl:template match="files.index">
<files Generated="{@Generated}">
<xsl:apply-templates select="file"/>
</files>
</xsl:template>
<xsl:template match="file">
<file path="{@path}" Prod_ID="{@Prod_ID}" Supplier_id="{@Supplier_id}" Catid="{@Catid}" Updated="{@Updated}" Quality="{@Quality}"/>
<xsl:apply-templates select="M_Prod_ID"/>
</xsl:template>
<xsl:template match="M_Prod_ID"/>
<xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)][following-sibling::M_Prod_ID][text() = following-sibling::M_Prod_ID/text()]" priority="5"/>
<xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)]">
<file path="{../@path}" Prod_ID="{.}" Catid="../@Catid" Updated="../@Updated" Quality="../@Quality">
<xsl:copy-of select="parent::*[not(current()/@Supplier_id)]/@Supplier_id | @Supplier_id" />
</file>
</xsl:template>
</xsl:stylesheet>
此转换的结果如下,与您的结果几乎相同,因为没有解释某些业务规则(主要是最后一个文件,但我确定您可以解决这个问题)。
<files Generated="20150916022750">
<file path="export/freexml.int/FR/29799266.xml" Prod_ID="89811499" Supplier_id="25" Catid="827" Updated="20150915223003" Quality="ICECAT" />
<file path="export/freexml.int/FR/4312841.xml" Prod_ID="003R92156" Supplier_id="30" Catid="197" Updated="20150523100119" Quality="ICECAT" />
<file path="export/freexml.int/FR/4312841.xml" Prod_ID="DOCUMATE 3640" Catid="197" Updated="20150523100119" Quality="ICECAT" />
<file path="export/freexml.int/FR/26064804.xml" Prod_ID="30097568" Supplier_id="11077" Catid="2943" Updated="20150827060248" Quality="ICECAT" />
<file path="export/freexml.int/FR/26064804.xml" Prod_ID="0000030097568" Catid="2943" Updated="20150827060248" Quality="ICECAT" />
<file path="export/freexml.int/FR/4312841.xml" Prod_ID="dfqsdfqfq6" Supplier_id="30" Catid="197" Updated="20150523100119" Quality="ICECAT" />
</files>
在您的原始帖子中,您将其写为某些属性的所需结果。
Catid="../@Catid"
Updated="../@Updated"
Quality="../@Quality"
我认为这是不正确的,并把它们变成了AVT。
作为赠品,这就是我将样式表从使用xsl:attribute
转换为AVT语法(使用XSLT 3.0,但可以简单地用于XSLT 1.0)的方式:
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="3.0">
<xsl:mode on-no-match="shallow-copy" />
<xsl:template match="xsl:element">
<xsl:element name="{@name}">
<xsl:apply-templates />
</xsl:element>
</xsl:template>
<xsl:template match="xsl:element/xsl:attribute">
<xsl:attribute name="{@name}" select="'{'||xsl:value-of/@select||'}'"/>
</xsl:template>
<xsl:template match="xsl:element/text()[not(normalize-space(.))]" />
</xsl:stylesheet>