标签: python regex
我想匹配以下标记
<text link="no"> ... </text>
唯一重要的是我希望将text = element与“link”作为属性以及内部的任何内容进行匹配。
我正在使用python,目前我有以下正则表达式无效:
'<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*'
所以我认为文本可能有其他属性。
非常感谢帮助!
答案 0 :(得分:0)
使用XML解析器(如libxml2或lxml或py-dom-xpath)和XPath,如:
//text[@link="no"]