在BeautifulSoup4中删除标记文本(但保留标记)

时间:2017-03-21 13:47:52

标签: python bs4

这是许多&#34;删除标记的反转,但保留内容&#34;问题 - 如何删除标记内的文字(例如<span foo="bar">text I don't want</span>但保留标记(例如<span foo="bar"></span>)?

1 个答案:

答案 0 :(得分:0)

只需将tag.string设置为空字符串即可。或者,使用tag.string.replace_with()

    bs = BeautifulSoup(html)
    for tag in bs.find_all('span'):
        # Strip all text by setting it to an empty string
        tag.string = ""
        # Or strip all text by replacing the string
        tag.string.replace_with("")