Question

我需要你的正则表达帮助。我有这样的xml文本：

<w><ana lex="совершенно" gr="ADV"></ana>соверш`енно</w>

我需要提取совершенно，ADV和соверш`енно。我试过了，但我知道正则表达式不太好。

Answer 1

您可以尝试使用BeautifulSoup。

Answer 2

在您的情况下，最好使用BeautifulSoup而不是正则表达式。

>>> import BeautifulSoup as bs
>>> xml = '<w><ana lex="совершенно" gr="ADV"></ana>соверш`енно</w>'
>>> soup = bs.BeautifulSoup(xml)
>>> print(soup.find('ana', {'lex':unicode}).get('lex'))
совершенно

Answer 3

以下是python正则表达式模型中的方法，它将返回您想要在答案中找到的数据的位置。

import re
data=re.search("соверш`енно","<w><ana lex="совершенно" gr="ADV">
</ana>соверш`енно</w>")

re.search（）函数返回字符串在文本中的位置，并提取其他字符串。

Answer 4

法= \＆＃34;（）\＆＃34; GR = \＆＃34;（）\＆＃34;＆GT;＆LT; / ANA＆GT;（*）＆LT; /并且R w

Regex101.com

XML中属性值的正则表达式

4 个答案: