Question

好的，我放弃了。我需要一些帮助。

我正在尝试在html文档中找到所有Header HTML标记。我想找到这些html标签并为它们添加一个增加id的id。我需要保持文档的结构。

我有几种不同的变化似乎无法正确使用。

from bs4 import BeautifulSoup

soup = BeautifulSoup(blog.body, "html.parser")
tags = soup.find_all()
count = 0
for item in tags:
    if r"^h\d$" in item:
        print('Found')
        count += 1
        item['id'] = count
        soup.append(item)
    soup.append(item)
print(soup)

Answer 1

如果你想没有重新做，另一个解决方案。它搜索所有html标签和beautifulSoup。

{{1}}

Beautifulsoup获取所有标题标签并添加Id属性增量

1 个答案: