我需要用另一个标签替换一对匹配的HTML标签。可能BeautifulSoup(4)适合完成任务,但我之前从未使用它,也没有在任何地方找到合适的例子,有人可以给我一个提示吗?
例如,此HTML代码:
<font color="red">this text is red</font>
应改为:
<span style="color: red;">this text is red</span>
开头和结尾的HTML标记可能不在同一行。
答案 0 :(得分:4)
使用replace_with()
替换元素。使文档示例适用于您的示例,提供:
>>> from bs4 import BeautifulSoup
>>> markup = '<font color="red">this text is red</font>'
>>> soup = BeautifulSoup(markup)
>>> soup.font
<font color="red">this text is red</font>
>>> new_tag = soup.new_tag('span')
>>> new_tag['style'] = 'color: ' + soup.font['color']
>>> new_tag.string = soup.font.string
>>> soup.font.replace_with(new_tag)
<font color="red">this text is red</font>
>>> soup
<span style="color: red">this text is red</span>