如何使用XPath通过其兄弟的属性发现XML节点?

时间:2015-09-07 17:48:39

标签: python xml python-3.x xpath elementtree

假设我有以下XML文件(可分配部分标有'...'):

<?xml version="1.0" encoding="ISO-8859-1"?>
<PARAMETERS version="1.6.2" xsi:noNamespaceSchemaLocation="http://open-ms.sourceforge.net/schemas/Param_1_6_2.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <NODE name="info" description="">
    <ITEM name="version" value="2.0.0" type="string" description="" required="false" advanced="false" />
    <ITEM name="num_vertices" value="5" type="int" description="" required="false" advanced="false" />
    <ITEM name="num_edges" value="4" type="int" description="" required="false" advanced="false" />
    <ITEM name="description" value="&lt;![CDATA[]]&gt;" type="string" description="" required="false" advanced="false" />
  </NODE>
  <NODE name="vertices" description="">
    <NODE name="0" description="">
      <ITEM name="recycle_output" value="false" type="string" description="" required="false" advanced="false" />
      <ITEM name="toppas_type" value="input file list" type="string" description="" required="false" advanced="false" />
      <ITEMLIST name="file_names" type="string" description="" required="false" advanced="false">
        <LISTITEM value="input_data/STD_MIX_1_25_neg.mzML"/>
      </ITEMLIST>
      <ITEM name="x_pos" value="-1680" type="double" description="" required="false" advanced="false" />
      <ITEM name="y_pos" value="-620" type="double" description="" required="false" advanced="false" />
    </NODE>
    <NODE name="1" description="">
    ...
    </NODE>
    ...
  </NODE>
</PARAMETERS>

我的目标是创建一个XPath查询,返回具有属性name =“file_names”的ITEMLIST节点和一个具有属性name =“toppas_type”,value =“input file list”的同级ITEM节点。我尝试了以下一个:

'./NODE/NODE[ITEM[@name="toppas_type"][@value="input file list"]]/ITEMLIST[@name="file_names"]'

在Python 3.4中使用xml.etree.ElementTree,但是我得到一个错误'无效谓词'。我认为我的查询包含一个愚蠢的错误,但我找不到它。

1 个答案:

答案 0 :(得分:1)

xml.etree.ElementTreelimited XPath support

  

此模块为XPath表达式提供有限的支持   在树中定位元素。目标是支持一小部分   缩写语法;完整的XPath引擎超出了范围   模块。

如果您可以切换到lxml,可以使用following-sibling轴解决:

//ITEM[@name = 'toppas_type' and @value = 'input file list']/following-sibling::ITEMLIST[@name = 'file_names']