如果子值等于另一个值,则更改XML孙子值

时间:2018-07-10 19:20:47

标签: python xml parsing element elementtree

我需要更正几百个XML文件。

假设文件的格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<MyData xmlns="urn:iso" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="urn:iso">
  <Hdr>
    <AppHdr xmlns="urn:iso" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="urn:iso">
      <St>A</St>
      <To>Z</To>
  </Hdr>
  <Data>
    <Document xmlns="urn:iso" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="urn:iso">
      <CountryReport>
        <RptHdr>
            <RpDtls>
                <Dt>2018-07-10</Dt>
          </RpDtls>
        </RptHdr>
        <Country>
          <Id>PT</Id>
          <FullNm>Portugal</FullNm>>
          <Bd>
            <Tp>US</Tp>
          </Bd>
        </Country>
        <Country>
          <Id>ESP</Id>
          <FullNm>Spain</FullNm>>
          <Bd>
            <Tp>EUR</Tp>
          </Bd>
        </Country>
      </CountryReport>
    </Document>
  </Data>
</MyData>

我需要做的替换如下:

  • 如果国家/地区ID为PT,则需要将Bd / Tp替换为“ EUR”。

我已经尝试使用sed,xmllint和ElementTrees使用python的不同方法,但是没有成功。

我可能使用了错误的xpath,但不幸的是我无法弄清楚。

你能帮忙吗?

1 个答案:

答案 0 :(得分:3)

实现目标的最简单方法是使用XSLT处理器。例如,使用调用Linux程序xsltproc或Windows / Linux程序saxon的脚本。

由于元素位于名称空间中,因此必须为元素定义它。例如,将xmlns:ui="urn:iso"添加到xsl:stylesheet元素中,然后将以下模板与身份模板结合使用:

<xsl:template match="ui:Country[ui:Id='PT']/ui:Bd/ui:Tp">
  <xsl:element name="Tp" namespace="{namespace-uri()}">EUR</xsl:element>
</xsl:template>

XSLT-1.0的身份模板是:

<xsl:template match="node()|@*">
  <xsl:copy>
    <xsl:apply-templates select="node()|@*" />
  </xsl:copy>
</xsl:template> 

对于XSLT-3.0,您可以改用以下说明:

<xsl:mode on-no-match="shallow-copy" />

因此,用于转换所有XML文件的完整XSLT-1.0文件如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:ui="urn:iso">
<xsl:output method="xml" omit-xml-declaration="yes" indent="yes"/>

  <!-- identity template -->
  <xsl:template match="node()|@*">
    <xsl:copy>
      <xsl:apply-templates select="node()|@*" />
    </xsl:copy>
   </xsl:template>  

  <xsl:template match="ui:Country[ui:Id='PT']/ui:Bd/ui:Tp">
    <xsl:element name="Tp" namespace="{namespace-uri()}">EUR</xsl:element>
  </xsl:template>

</xsl:stylesheet>

一个xsltproc bash命令看起来像

for file in *; do xsltproc transform.xslt $file > $file.NEW; done;