使用python / BeautifulSoup将HTML标记对替换为另一个

时间:2013-03-21 10:59:16

标签: python html replace tags beautifulsoup

我需要用另一个标签替换一对匹配的HTML标签。可能BeautifulSoup(4)适合完成任务,但我之前从未使用它,也没有在任何地方找到合适的例子,有人可以给我一个提示吗?

例如,此HTML代码:

<font color="red">this text is red</font>

应改为:

<span style="color: red;">this text is red</span>

开头和结尾的HTML标记可能不在同一行。

1 个答案:

答案 0 :(得分:4)

使用replace_with()替换元素。使文档示例适用于您的示例,提供:

>>> from bs4 import BeautifulSoup
>>> markup = '<font color="red">this text is red</font>'
>>> soup = BeautifulSoup(markup)
>>> soup.font
<font color="red">this text is red</font>
>>> new_tag = soup.new_tag('span')
>>> new_tag['style'] = 'color: ' + soup.font['color']
>>> new_tag.string = soup.font.string
>>> soup.font.replace_with(new_tag)
<font color="red">this text is red</font>
>>> soup
<span style="color: red">this text is red</span>