使用re在字符串中查找嵌套结果

时间:2015-02-22 20:23:44

标签: python regex

大家好我有以下字符串:

test = '<tr> <stuff1> <tr><stuff2> </tr> </tr>'

我希望python返回以下内容:

result=['<tr><stuff1><tr><stuff2></tr></tr>','<tr><stuff2></tr>']

我已经尝试了re.finall('<tr>.+</tr>',test)但只返回整个字符串...

由于

1 个答案:

答案 0 :(得分:2)

您应该使用html解析器来解析html:

from bs4 import BeautifulSoup

html = """<tr> <stuff1> <tr><stuff2> </tr> </tr>"""
soup =BeautifulSoup(html)

print(soup.find_all("tr"))