XML中属性值的正则表达式

时间:2017-04-14 09:03:11

标签: python regex

我需要你的正则表达帮助。我有这样的xml文本:

<w><ana lex="совершенно" gr="ADV"></ana>соверш`енно</w>

我需要提取совершенно,ADV和соверш`енно。我试过了,但我知道正则表达式不太好。

4 个答案:

答案 0 :(得分:0)

您可以尝试使用BeautifulSoup

答案 1 :(得分:0)

在您的情况下,最好使用BeautifulSoup而不是正则表达式。

>>> import BeautifulSoup as bs
>>> xml = '<w><ana lex="совершенно" gr="ADV"></ana>соверш`енно</w>'
>>> soup = bs.BeautifulSoup(xml)
>>> print(soup.find('ana', {'lex':unicode}).get('lex'))
совершенно

答案 2 :(得分:-1)

以下是python正则表达式模型中的方法,它将返回您想要在答案中找到的数据的位置。

import re
data=re.search("соверш`енно","<w><ana lex="совершенно" gr="ADV">
</ana>соверш`енно</w>")

re.search()函数返回字符串在文本中的位置,并提取其他字符串。

答案 3 :(得分:-3)

法= \&#34;()\&#34; GR = \&#34;()\&#34;&GT;&LT; / ANA&GT;(*)&LT; /并且R w

Regex101.com