正则表达式匹配Python中的特定xml部分

时间:2013-01-09 10:12:10

标签: python regex

我想匹配以下标记

<text link="no">
    ...
</text>

唯一重要的是我希望将text = element与“link”作为属性以及内部的任何内容进行匹配。

我正在使用python,目前我有以下正则表达式无效:

'<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*'

所以我认为文本可能有其他属性。

非常感谢帮助!

1 个答案:

答案 0 :(得分:0)

使用XML解析器(如libxml2lxmlpy-dom-xpath)和XPath,如:

//text[@link="no"]