如何在bs4中使用新标记包装标记。
例如我有这样的HTML。
<html>
<body>
<p>Demo</p>
<p>world</p>
</body>
</html>
我想将其转换为此。
<html>
<body>
<b><p>Demo</p></b>
<b> <p>world</p> </b>
</body>
</html>
这是例证。
from bs4 import BeautifulSoup
html = """
<html>
<body>
<p>Demo</p>
<p>world</p>
</body>
</html>"""
soup = BeautifulSoup(html, 'html.parser')
for tag in soup.find_all('p'):
# wrap tag with '<b>'
答案 0 :(得分:1)
from bs4 import BeautifulSoup
html = """
<html>
<body>
<p>Demo</p>
<p>world</p>
</body>
</html>"""
soup = BeautifulSoup(html, 'html.parser')
for p in soup('p'): # shortcut for soup.find_all('p')
p.wrap(soup.new_tag("b"))
出:
<html>
<body>
<b><p>Demo</p></b>
<b><p>world</p></b>
</body>
</html>