XSLT转换:更新输出xml的节点

时间:2015-05-18 12:36:51

标签: c# xml xslt xpath

我有以下方案,我正在努力解决这个问题。我不完全确定我的解决方案是否正确(但它使用XPath和C#代码)。在xslt中也复制了几乎相似的逻辑。

注意事项: XML是来自第三方的输入。我不能改变它的结构。

所以我的输入xml是这样的

<?xml version="1.0" encoding="utf-8"?>
<Root>
  <Houses>
    <House id="0" address="House1" area="XX"/>
    <House id="1" address="House2" area="XX"/>
    <House id="0" address="House1" area="YY"/>
    <House id="1" address="House2" area="YY"/>
  </Houses>
  <VisitModule>
    <VisitedBy personID="ABC">
      <VisitedArea id="XX">
        <VisitedHouse houseID="0" isVisited="false" />
        <VisitedHouse houseID="1" isVisited="false" />
      </VisitedArea>
    </VisitedBy>
    <VisitedBy personID="XYZ">
      <VisitedArea id="XX">
        <VisitedHouse houseID="0" isVisited="true" />
        <VisitedHouse houseID="1" isVisited="false" />
      </VisitedArea>
      <VisitedArea id="YY">
        <VisitedHouse houseID="0" isVisited="false" />
        <VisitedHouse houseID="1" isVisited="false" />
      </VisitedArea>
    </VisitedBy>
  </VisitModule>
</Root>

我希望实现的是,如果任何人访问过这所房子,那么该房屋将被标记为其他地方。

我需要的输出xml有点像下面,

<?xml version="1.0" encoding="utf-8"?>
<Root>
  <VisitedArea id="XX">
    <!--If covered by any person, its covered=true.-->
    <House id ="0" covered="true" />
    <House id ="1" covered="false" />
  </VisitedArea>
  <VisitedArea id="YY">
    <House id ="0" covered="false" />
    <House id ="1" covered="false" />
  </VisitedArea>
</Root>

我已将此作为XML遍历的一部分。但它的速度令人难以置信(因为当前的输入XML是巨大的)。因此希望通过XSLT来实现,这应该更快。

我使用过的想法是,遍历每个house节点,根据area和id找到匹配的houseID,然后进行计算。

我已经在XSLT中使用了大部分工作,除了我需要更新现有节点的数据,比如说区域XX的房子1,之前没有访问过,但现在我找到了一个访问过该节点的人员节点房子,所以我现在需要将该节点设置为

covered=true

我无法找到任何指向编辑当前正在转换的文档的内容。我并不是说我的方法是100%正确的,所以我也对其他想法持开放态度。但我认为使用XSLT会使我的生活在维护方面比实际代码更容易,所以非常希望在XSLT中完成它。

先谢谢。 :)

1 个答案:

答案 0 :(得分:1)

这是使用XSLT的一种可能的解决方案。它的工作原理是获取所有区域的明确列表,然后使用Houses子元素下的房屋列表,检查每个区域,看看是否有任何节点匹配在被覆盖的房屋被访问的访问区域下covered属性的正确值。

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:msxsl="urn:schemas-microsoft-com:xslt" exclude-result-prefixes="msxsl"
>
  <xsl:output method="xml" indent="yes"/>
    <!-- get distinct list of areas -->
    <xsl:template match="/">
      <Root>
        <xsl:for-each select="//House/@area[not(.=following::House/@area)]">
          <xsl:call-template name="areaTemplate">
            <xsl:with-param name="areaCode" select="." />
          </xsl:call-template>
        </xsl:for-each>
      </Root>
    </xsl:template>

    <!-- for each area check each house to see if covered -->
    <xsl:template name="areaTemplate">
      <xsl:param name="areaCode" />
      <VisitedArea id="{$areaCode}">
      <xsl:for-each select="//House[@area=$areaCode]">
        <xsl:variable name ="houseId" select="@id" />
        <xsl:variable name ="covered" select="boolean(//VisitedArea[@id=$areaCode]/VisitedHouse[@isVisited='true' and @houseID=$houseId])" />
        <House id="{$houseId}" covered="{$covered}" />
      </xsl:for-each>
      </VisitedArea>
  </xsl:template>

</xsl:stylesheet>

给定样本输入XML的输出应为:

<?xml version="1.0" encoding="utf-8"?>
<Root>
  <VisitedArea id="XX">
    <House id="0" covered="true" />
    <House id="1" covered="false" />
  </VisitedArea>
  <VisitedArea id="YY">
    <House id="0" covered="false" />
    <House id="1" covered="false" />
  </VisitedArea>
</Root>

我还没有测试过它的性能;另一种方法可能是将输入xml反序列化为类,将它们操作到必要的组中,然后序列化回目标xml。