好的,我放弃了。我需要一些帮助。
我正在尝试在html文档中找到所有Header HTML标记。我想找到这些html标签并为它们添加一个增加id的id。我需要保持文档的结构。
我有几种不同的变化似乎无法正确使用。
from bs4 import BeautifulSoup
soup = BeautifulSoup(blog.body, "html.parser")
tags = soup.find_all()
count = 0
for item in tags:
if r"^h\d$" in item:
print('Found')
count += 1
item['id'] = count
soup.append(item)
soup.append(item)
print(soup)
答案 0 :(得分:1)
如果你想没有重新做,另一个解决方案。它搜索所有html标签和beautifulSoup。
{{1}}