电子表格XML在XSLT中创建父/子层次结构

时间:2013-04-23 09:45:10

标签: xml xslt

我有以下电子表格XML:

<Workbook>
    <Worksheet ss:Name="Sheet1">
        <Table>
            <Row>
                <Cell><Data ss:Type="String">Parent</Data></Cell>
                <Cell><Data ss:Type="String">Child</Data></Cell>
            </Row>
            <Row>
                <Cell><Data ss:Type="String">A</Data></Cell>
                <Cell><Data ss:Type="String">B</Data></Cell>
            </Row>
            <Row>
                <Cell><Data ss:Type="String">A</Data></Cell>
                <Cell><Data ss:Type="String">C</Data></Cell>
            </Row>
            <Row>
                <Cell><Data ss:Type="String">B</Data></Cell>
                <Cell><Data ss:Type="String">D</Data></Cell>
            </Row>
            <Row>
                <Cell><Data ss:Type="String">B</Data></Cell>
                <Cell><Data ss:Type="String">E</Data></Cell>
            </Row>
            <Row>
                <Cell><Data ss:Type="String">C</Data></Cell>
                <Cell><Data ss:Type="String">F</Data></Cell>
            </Row>
            <Row>
                <Cell><Data ss:Type="String">C</Data></Cell>
                <Cell><Data ss:Type="String">G</Data></Cell>
            </Row>
        </Table>
    </Worksheet>
</Workbook>

我希望使用Saxon XSLT 2.0将其转换为以下格式:

<Something id="A">
    <Something id="B">
        <Something id="D"/>
        <Something id="E"/>
    </Something>
    <Something id="C">
        <Something id="F"/>
        <Something id="G"/>
    </Something>
</Something>

有人能够帮忙解决这个问题吗?我相信答案在于递归的 apply-templates (虽然我希望for-each可能会达到同样的效果)。

非常感谢。

更新:为了回应Navin,我一直在尝试看起来如下的XSLT,但我担心我正在咆哮错误的树(可能在我的小组中 - 开始 - ?):

<xsl:stylesheet 
    version="2.0"
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
    xmlns:o="urn:schemas-microsoft-com:office:office"
    xmlns:x="urn:schemas-microsoft-com:office:excel"
    xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
    xmlns:html="http://www.w3.org/TR/REC-html40"
    xpath-default-namespace="urn:schemas-microsoft-com:office:spreadsheet"
    exclude-result-prefixes="o x ss html"
    >   

    <xsl:output method="xml" indent="yes" />

    <xsl:template match="Workbook/Worksheet[@ss:Name='Sheet1']/Table">      
        <xsl:variable name="row_header" select="count(Row/Cell[.='Parent']/preceding-sibling::Row)+1"/>
        <xsl:apply-templates select="Row[position() > $row_header]">
            <xsl:with-param name="row_header" select="$row_header"/>
        </xsl:apply-templates>  
    </xsl:template>

    <xsl:template match="Row">
        <xsl:param name="row_header"/>
        <xsl:variable name="ChildId" select="Cell[count(ancestor::*/Row[$row_header]/Cell[.='Child']/preceding-sibling::Cell)+1]"/>
        <xsl:variable name="ParentId" select="Cell[count(ancestor::*/Row[$row_header]/Cell[.='Parent']/preceding-sibling::Cell)+1]"/>
        <xsl:for-each-group select="*" group-starting-with="Row">
            <Something id="{$ChildId}">
                <xsl:apply-templates select="current-group()[position() &gt; 1]" mode="Child">
                    <xsl:with-param name="ChildId" select="$ChildId"/>
                </xsl:apply-templates>
            </Something>
        </xsl:for-each-group>
    </xsl:template> 

    <xsl:template match="*" mode="Child">
        <xsl:param name="ChildId"/>
            <Something id="{$ChildId}"/>
    </xsl:template>

</xsl:stylesheet>

2 个答案:

答案 0 :(得分:2)

可能有更好的XSLT 2.0方法,但这里是如何在XSLT 1.0中完成的:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output method="xml" indent="yes" omit-xml-declaration="yes"/>
  <xsl:key name="kChildren" match="Row" use="Cell[2]/Data"/>
  <xsl:key name="kParent" match="Row" use="Cell[1]/Data "/>

  <xsl:template match="/">
    <xsl:apply-templates 
             select="*/*/*/*[position() != 1]
                            [not(key('kChildren', Cell[1]/Data))]
                            [generate-id() = 
                             generate-id(key('kParent', Cell[1]/Data)[1])]">
      <xsl:with-param name="idCell" select="1" />
    </xsl:apply-templates>
  </xsl:template>

  <xsl:template match="Row">
    <xsl:param name="idCell" select="2" />
    <Something id="{Cell[$idCell]/Data}">
      <xsl:apply-templates
        select="key('kParent', Cell[$idCell]/Data)
                      [generate-id() = 
                       generate-id(key('kChildren', Cell[2]/Data)[1])]" />
    </Something>
  </xsl:template>
</xsl:stylesheet>

在样本输入上运行时,结果为:

<Something id="A">
  <Something id="B">
    <Something id="D" />
    <Something id="E" />
  </Something>
  <Something id="C">
    <Something id="F" />
    <Something id="G" />
  </Something>
</Something>

答案 1 :(得分:1)

像以下xslt这样的东西会做。 (仅尝试使用xlt版本1.0并且mamesppace存在一些问题。)它不是很灵活,它假设第一行是标题,第一行是父,第二行是子。

<xsl:stylesheet version="1.0" 
                xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
                xmlns:ss="Sheet1"
                >
    <xsl:output method="xml" indent="yes"/>

    <xsl:template match="/">
        <xsl:variable name ="parent">
            <xsl:value-of select="//Row[2]/Cell[1]/Data"/>
        </xsl:variable>
        <Something id="{$parent}">
            <xsl:apply-templates select="//Row[Cell[position()=1 and Data=$parent]]" />
        </Something>

    </xsl:template>

    <xsl:template match="Row">

        <xsl:variable name ="child">
            <xsl:value-of select="Cell[2]/Data"/>
        </xsl:variable>
        <Something id="{$child}">
            <xsl:apply-templates select="//Row[Cell[position()=1 and Data=$child]]" />
        </Something>
    </xsl:template>
</xsl:styles

生成的输出为:

<?xml version="1.0"?>
<Something xmlns:ss="Sheet1" id="A">
  <Something id="B">
    <Something id="D"/>
    <Something id="E"/>
  </Something>
  <Something id="C">
    <Something id="F"/>
    <Something id="G"/>
  </Something>
</Something>