假设我有以下XML文件(可分配部分标有'...'):
<?xml version="1.0" encoding="ISO-8859-1"?>
<PARAMETERS version="1.6.2" xsi:noNamespaceSchemaLocation="http://open-ms.sourceforge.net/schemas/Param_1_6_2.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<NODE name="info" description="">
<ITEM name="version" value="2.0.0" type="string" description="" required="false" advanced="false" />
<ITEM name="num_vertices" value="5" type="int" description="" required="false" advanced="false" />
<ITEM name="num_edges" value="4" type="int" description="" required="false" advanced="false" />
<ITEM name="description" value="<![CDATA[]]>" type="string" description="" required="false" advanced="false" />
</NODE>
<NODE name="vertices" description="">
<NODE name="0" description="">
<ITEM name="recycle_output" value="false" type="string" description="" required="false" advanced="false" />
<ITEM name="toppas_type" value="input file list" type="string" description="" required="false" advanced="false" />
<ITEMLIST name="file_names" type="string" description="" required="false" advanced="false">
<LISTITEM value="input_data/STD_MIX_1_25_neg.mzML"/>
</ITEMLIST>
<ITEM name="x_pos" value="-1680" type="double" description="" required="false" advanced="false" />
<ITEM name="y_pos" value="-620" type="double" description="" required="false" advanced="false" />
</NODE>
<NODE name="1" description="">
...
</NODE>
...
</NODE>
</PARAMETERS>
我的目标是创建一个XPath查询,返回具有属性name =“file_names”的ITEMLIST节点和一个具有属性name =“toppas_type”,value =“input file list”的同级ITEM节点。我尝试了以下一个:
'./NODE/NODE[ITEM[@name="toppas_type"][@value="input file list"]]/ITEMLIST[@name="file_names"]'
在Python 3.4中使用xml.etree.ElementTree,但是我得到一个错误'无效谓词'。我认为我的查询包含一个愚蠢的错误,但我找不到它。
答案 0 :(得分:1)
xml.etree.ElementTree
有limited XPath support:
此模块为XPath表达式提供有限的支持 在树中定位元素。目标是支持一小部分 缩写语法;完整的XPath引擎超出了范围 模块。
如果您可以切换到lxml
,可以使用following-sibling
轴解决:
//ITEM[@name = 'toppas_type' and @value = 'input file list']/following-sibling::ITEMLIST[@name = 'file_names']