使用BeautifulSoup </h2> </div>将<div>标记替换为<h2>标记

时间:2014-02-11 14:35:02

标签: python beautifulsoup

我有很多html文件,我需要将具有特定属性span的所有divclass标记替换为h3标记。

例如,

在:

<div class="style1"> Text </div>

<span class="style1"> Text2 </span>

后:

<h3> Text </h3>

<h3> Text2 </h3>

如何使用BeautifulSoup库执行此操作?

1 个答案:

答案 0 :(得分:3)

您可以设置标签的名称属性以进行更改:

bs = BeautifulSoup("<div>text</div>")
bs.find("div").name = "h2"

print bs # "<h2>text</h2>"