删除双条目后,我也丢失了一些其他元素

时间:2015-09-16 14:27:47

标签: xml xslt xslt-grouping

我有一个vrey大xml文件。我尝试生成一个leigther xml文件,用它来用SSIS提取数据。

我的文件包含几个案例。我把每个案例here

我提取了4个简化的案例

 <ICECAT-interface xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="http://data.icecat.biz/xsd/files.index.xsd">
 <files.index Generated="20150916022750">
  <file path="export/freexml.int/FR/29799266.xml" Product_ID="29799266" Updated="20150915223003" Quality="ICECAT" Supplier_id="25" Prod_ID="89811499" Catid="827" On_Market="0" Model_Name="AmazonLED" Product_View="0" HighPic="http://images.icecat.biz/img/gallery/29799266_6440.jpg" HighPicSize="189800" HighPicWidth="2000" HighPicHeight="2000" Date_Added="20150915000000"></file>
 <file path="export/freexml.int/FR/4312841.xml" Product_ID="4312841" Updated="20150523100119" Quality="ICECAT" Supplier_id="30" Prod_ID="003R92156" Catid="197" On_Market="1" Model_Name="3640" Product_View="32767" HighPic="http://images.icecat.biz/img/norm/high/4312841-1574.jpg" HighPicSize="289900" HighPicWidth="1552" HighPicHeight="1200" Date_Added="20100306000000">
  <M_Prod_ID>DOCUMATE 3640</M_Prod_ID>
  <M_Prod_ID>003R92156</M_Prod_ID>
</file>
 <file path="export/freexml.int/FR/26064804.xml" Product_ID="26064804" Updated="20150827060248" Quality="ICECAT" Supplier_id="11077" Prod_ID="30097568" Catid="2943" On_Market="0" Model_Name="Color Show 110 Urban Coral" Product_View="2819" HighPic="http://images.icecat.biz/img/norm/high/26064804-6070.jpg" HighPicSize="34989" HighPicWidth="400" HighPicHeight="355" Date_Added="20150127000000">
      <M_Prod_ID>0000030097568</M_Prod_ID>
      <M_Prod_ID>0000030097568</M_Prod_ID>
</file>
<file path="export/freexml.int/FR/4312841.xml" Product_ID="4312841" Updated="20150523100119" Quality="ICECAT" Supplier_id="30" Prod_ID="dfqsdfqfq6" Catid="197" On_Market="1" Model_Name="3640" Product_View="32767" HighPic="http://images.icecat.biz/img/norm/high/4312841-1574.jpg" HighPicSize="289900" HighPicWidth="1552" HighPicHeight="1200" Date_Added="20100306000000">
  <M_Prod_ID Supplier_id="670" Supplier_name="Visioneer">dfqsdfqfq6</M_Prod_ID>
</file>
</files.index>
</ICECAT-interface>

我的xslt

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output  method="xml" encoding="UTF-8" indent="yes"/>

<xsl:template match="/">
    <xsl:apply-templates/>
</xsl:template>

<xsl:template match="ICECAT-interface">
    <xsl:apply-templates select="files.index"/>
</xsl:template>

<xsl:template match="files.index">
    <xsl:element name="files">
        <xsl:attribute name="Generated">
            <xsl:value-of select="@Generated"/>
        </xsl:attribute>
        <xsl:apply-templates select="file"/>
    </xsl:element>

</xsl:template>

<xsl:template match="file">
    <xsl:element name="file">
        <xsl:attribute name="path">
            <xsl:value-of select="@path"/>
        </xsl:attribute>
        <xsl:attribute name="Prod_ID">
            <xsl:value-of select="@Prod_ID"/>
        </xsl:attribute>
        <xsl:attribute name="Supplier_id">
            <xsl:value-of select="@Supplier_id"/>
        </xsl:attribute>
        <xsl:attribute name="Catid">
            <xsl:value-of select="@Catid"/>
        </xsl:attribute>
        <xsl:attribute name="Updated">
            <xsl:value-of select="@Updated"/>
        </xsl:attribute>
        <xsl:attribute name="Quality">
            <xsl:value-of select="@Quality"/>
        </xsl:attribute>
    </xsl:element>
    <xsl:apply-templates select="M_Prod_ID"/>
</xsl:template>

<xsl:template match="M_Prod_ID" />

<xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)]">
    <file path="{../@path}" Prod_ID="{.}" Catid="../@Catid" Updated="../@Updated" Quality="../@Quality">

        <xsl:attribute name="Supplier_id">
            <xsl:choose>
                <xsl:when test="@Supplier_id">
                    <xsl:value-of select="@Supplier_id"/>
                </xsl:when>
                <xsl:otherwise>
                    <xsl:value-of select="../@Supplier_id"/>
                </xsl:otherwise>
            </xsl:choose>
        </xsl:attribute>
    </file>

</xsl:template>

</xsl:stylesheet>

结果

 <files Generated="20150916022750">
  <file path="export/freexml.int/FR/29799266.xml"
     Prod_ID="89811499"
     Supplier_id="25"
     Catid="827"
     Updated="20150915223003"
     Quality="ICECAT"/>
  <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="003R92156"
     Supplier_id="30"
     Catid="197"
     Updated="20150523100119"
     Quality="ICECAT"/>
   <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="DOCUMATE 3640"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="30"/>
   <file path="export/freexml.int/FR/26064804.xml"
     Prod_ID="30097568"
     Supplier_id="11077"
     Catid="2943"
     Updated="20150827060248"
     Quality="ICECAT"/>
   <file path="export/freexml.int/FR/26064804.xml"
     Prod_ID="0000030097568"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="11077"/>
  <file path="export/freexml.int/FR/26064804.xml"
     Prod_ID="0000030097568"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="11077"/>
  <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="dfqsdfqfq6"
     Supplier_id="30"
     Catid="197"
     Updated="20150523100119"
     Quality="ICECAT"/>
  </files>

2问题是

<file path="export/freexml.int/FR/26064804.xml"
     Prod_ID="0000030097568"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="11077"/>

重复两次。

,最后一行与Supplier_Id = 670

不重复

在先前的问题。 @Abel说使用

 <xsl:template match="M_Prod_ID[text() = following-sibling::M_Prod_ID/text()]">

结果here

然后文件节点重复两次就好了,但我丢失了文件节点

<file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="DOCUMATE 3640"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="30"/>

我如何混合两种解决方案? 其他人说使用分组。但我不知道它是如何运行的。

更新

我想要

<files Generated="20150916022750">
  <file path="export/freexml.int/FR/29799266.xml"
     Prod_ID="89811499"
     Supplier_id="25"
     Catid="827"
     Updated="20150915223003"
     Quality="ICECAT"/>
   <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="003R92156"
     Supplier_id="30"
     Catid="197"
     Updated="20150523100119"
     Quality="ICECAT"/>
  <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="DOCUMATE 3640"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="30"/>
  <file path="export/freexml.int/FR/26064804.xml"
     Prod_ID="30097568"
     Supplier_id="11077"
     Catid="2943"
     Updated="20150827060248"
     Quality="ICECAT"/>
  <file path="export/freexml.int/FR/26064804.xml"
     Prod_ID="0000030097568"
     Catid="../@Catid"
     Updated="../@Updated"
     Quality="../@Quality"
     Supplier_id="11077"/>
   <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="dfqsdfqfq6"
     Supplier_id="30"
     Catid="197"
     Updated="20150523100119"
     Quality="ICECAT"/>
   <file path="export/freexml.int/FR/4312841.xml"
     Prod_ID="dfqsdfqfq6"
     Supplier_id="670"
     Catid="197"
     Updated="20150523100119"
     Quality="ICECAT"/>
</files>

1 个答案:

答案 0 :(得分:1)

现在很清楚您想要什么,我认为解决方案比您第一次发布问题时看起来更容易。非常感谢您展示相关代码。

此代码

 <xsl:template match="M_Prod_ID[text() = following-sibling::M_Prod_ID/text()]">

正在测试两个兄弟M_Prod_ID之间的重复项,但它没有假设这些重复项也可能出现一次。

XSLT 1.0中的解决方案并不像人们想象的那么简单,它显示了迈克尔建议选择Muenchian分组的原因。这是非Muenchian方式:

<xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)][following-sibling::M_Prod_ID][text() = following-sibling::M_Prod_ID/text()]" priority="5"/>

这里它适用于样式表的简化版本:

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output method="xml" encoding="UTF-8" indent="yes"/>

    <xsl:template match="/">
        <xsl:apply-templates/>
    </xsl:template>

    <xsl:template match="ICECAT-interface">
        <xsl:apply-templates select="files.index"/>
    </xsl:template>

    <xsl:template match="files.index">
        <files Generated="{@Generated}">
            <xsl:apply-templates select="file"/>
        </files>    
    </xsl:template>

    <xsl:template match="file">
        <file path="{@path}" Prod_ID="{@Prod_ID}" Supplier_id="{@Supplier_id}" Catid="{@Catid}" Updated="{@Updated}" Quality="{@Quality}"/>
        <xsl:apply-templates select="M_Prod_ID"/>
    </xsl:template>

    <xsl:template match="M_Prod_ID"/>

    <xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)][following-sibling::M_Prod_ID][text() = following-sibling::M_Prod_ID/text()]" priority="5"/>

    <xsl:template match="M_Prod_ID[not(. = ../@Prod_ID)]">
        <file path="{../@path}" Prod_ID="{.}" Catid="../@Catid" Updated="../@Updated" Quality="../@Quality">
            <xsl:copy-of select="parent::*[not(current()/@Supplier_id)]/@Supplier_id | @Supplier_id" />
        </file>
    </xsl:template>

</xsl:stylesheet>

此转换的结果如下,与您的结果几乎相同,因为没有解释某些业务规则(主要是最后一个文件,但我确定您可以解决这个问题)。

<files Generated="20150916022750">
  <file path="export/freexml.int/FR/29799266.xml" Prod_ID="89811499" Supplier_id="25" Catid="827" Updated="20150915223003" Quality="ICECAT" />
  <file path="export/freexml.int/FR/4312841.xml" Prod_ID="003R92156" Supplier_id="30" Catid="197" Updated="20150523100119" Quality="ICECAT" />
  <file path="export/freexml.int/FR/4312841.xml" Prod_ID="DOCUMATE 3640" Catid="197" Updated="20150523100119" Quality="ICECAT" />
  <file path="export/freexml.int/FR/26064804.xml" Prod_ID="30097568" Supplier_id="11077" Catid="2943" Updated="20150827060248" Quality="ICECAT" />
  <file path="export/freexml.int/FR/26064804.xml" Prod_ID="0000030097568" Catid="2943" Updated="20150827060248" Quality="ICECAT" />
  <file path="export/freexml.int/FR/4312841.xml" Prod_ID="dfqsdfqfq6" Supplier_id="30" Catid="197" Updated="20150523100119" Quality="ICECAT" />
</files>

在您的原始帖子中,您将其写为某些属性的所需结果。

 Catid="../@Catid"
 Updated="../@Updated"
 Quality="../@Quality"

我认为这是不正确的,并把它们变成了AVT。

作为赠品,这就是我将样式表从使用xsl:attribute转换为AVT语法(使用XSLT 3.0,但可以简单地用于XSLT 1.0)的方式:

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    version="3.0">

    <xsl:mode on-no-match="shallow-copy" />

    <xsl:template match="xsl:element">
        <xsl:element name="{@name}">
            <xsl:apply-templates />
        </xsl:element>
    </xsl:template>

    <xsl:template match="xsl:element/xsl:attribute">
        <xsl:attribute name="{@name}" select="'{'||xsl:value-of/@select||'}'"/>        
    </xsl:template>

    <xsl:template match="xsl:element/text()[not(normalize-space(.))]" />

</xsl:stylesheet>