我需要你的正则表达帮助。我有这样的xml文本:
<w><ana lex="совершенно" gr="ADV"></ana>соверш`енно</w>
我需要提取совершенно,ADV和соверш`енно。我试过了,但我知道正则表达式不太好。
答案 0 :(得分:0)
您可以尝试使用BeautifulSoup
。
答案 1 :(得分:0)
在您的情况下,最好使用BeautifulSoup
而不是正则表达式。
>>> import BeautifulSoup as bs
>>> xml = '<w><ana lex="совершенно" gr="ADV"></ana>соверш`енно</w>'
>>> soup = bs.BeautifulSoup(xml)
>>> print(soup.find('ana', {'lex':unicode}).get('lex'))
совершенно
答案 2 :(得分:-1)
以下是python正则表达式模型中的方法,它将返回您想要在答案中找到的数据的位置。
import re
data=re.search("соверш`енно","<w><ana lex="совершенно" gr="ADV">
</ana>соверш`енно</w>")
re.search()函数返回字符串在文本中的位置,并提取其他字符串。
答案 3 :(得分:-3)
法= \&#34;()\&#34; GR = \&#34;()\&#34;&GT;&LT; / ANA&GT;(*)&LT; /并且R w