我有很多html文件,我需要将具有特定属性span
的所有div
或class
标记替换为h3
标记。
例如,
在:
<div class="style1"> Text </div>
<span class="style1"> Text2 </span>
后:
<h3> Text </h3>
<h3> Text2 </h3>
如何使用BeautifulSoup库执行此操作?
答案 0 :(得分:3)
您可以设置标签的名称属性以进行更改:
bs = BeautifulSoup("<div>text</div>")
bs.find("div").name = "h2"
print bs # "<h2>text</h2>"