如何在Python中使用lxml来获取以下元素?

时间:2015-11-23 10:08:25

标签: python xml python-2.7 lxml xml.etree

我有下一个XML文件:

<separator colspan="4" string="Application"/>
<field name="sel_groups_9_28_10" modifiers="{}"/>
<newline/>
<field name="sel_groups_49_50" modifiers="{}"/>
<newline/>
<field name="sel_groups_68" modifiers="{}"/>
<newline/>
<field name="sel_groups_36_37" modifiers="{}"/>
<newline/>
<field name="sel_groups_21_22_23" modifiers="{}"/>
<newline/>
<field name="sel_groups_43_44" modifiers="{}"/>
<newline/>
<field name="sel_groups_5_57_58" modifiers="{}"/>
<newline/>
<field name="sel_groups_59_60" modifiers="{}"/>
<newline/>
<field name="sel_groups_61_62" modifiers="{}"/>
<newline/>
<field name="sel_groups_19" modifiers="{}"/>
<newline/>
<field name="sel_groups_3_4" modifiers="{}"/>
<newline/>
<separator colspan="4" string="MY GROUP"/>
<field name="in_group_144" modifiers="{}"/>
<field name="in_group_142" modifiers="{}"/>
<field name="in_group_148" modifiers="{}"/>
<field name="in_group_147" modifiers="{}"/>
<field name="in_group_146" modifiers="{}"/>
<field name="in_group_145" modifiers="{}"/>
<field name="in_group_141" modifiers="{}"/>
<field name="in_group_143" modifiers="{}"/>
<separator colspan="4" string="Technical configuration"/>
<field name="in_group_30" modifiers="{}"/>
<field name="in_group_46" modifiers="{}"/>
<field name="in_group_12" modifiers="{}"/>
<field name="in_group_45" modifiers="{}"/>
<field name="in_group_33" modifiers="{}"/>
<field name="in_group_66" modifiers="{}"/>
<field name="in_group_25" modifiers="{}"/>
<field name="in_group_32" modifiers="{}"/>

树的常见结构是:

<separator 1/>
<field 1/>
<field 2/>
<field N/>
<separator 2/>
<field 1/>
<field 2/>
<field N/>
<separator N/>
<field 1/>
<field 2/>
<field N/>

我想要的是获取其字符串与 MY GROUP 不同的分隔符以及所有以下字段,直到下一个分隔符(我的目的是使每个元素不可见,除了分隔符我的小组和字段 in_group_144 in_group_142 in_group_148 in_group_147 in_group_146 in_group_145 in_group_141 in_group_143 )。

XML树将改变其字段名称,因此按名称获取字段将不是解决方案。

这里lxml/Python : get previous-sibling给出了如何获得前一个兄弟,但是我怎样才能以有效的方式获得其标签为 separator 的上一个兄弟?

我目前的解决方案:

def get_previous_separator(self, element):
    previous_element = element.getprevious()
    if previous_element.tag == 'separator':
        return previous_element
    else:
        return get_previous_separator(element)

for element in tree:
    if self.get_previous_separator(element).string != 'MY GROUP':
        MAKE ELEMENT INVISIBLE

有没有比递归方法更直接的方法来管理我的目标?

0 个答案:

没有答案