大家好我有以下字符串:
test = '<tr> <stuff1> <tr><stuff2> </tr> </tr>'
我希望python返回以下内容:
result=['<tr><stuff1><tr><stuff2></tr></tr>','<tr><stuff2></tr>']
我已经尝试了re.finall('<tr>.+</tr>',test)
但只返回整个字符串...
由于
答案 0 :(得分:2)
您应该使用html解析器来解析html:
from bs4 import BeautifulSoup
html = """<tr> <stuff1> <tr><stuff2> </tr> </tr>"""
soup =BeautifulSoup(html)
print(soup.find_all("tr"))