我的span标记包含:<span id="internal-source-marker_0.9510186333209276"><span>
我想要做的是将其转换为<span><span>
基本上,我想检查span是否有id值,然后将其完全删除。我完全很困惑如何解决这个问题。它应该是正则表达还是美丽的汤?
正则表达式的问题在于我不确定如何在匹配后替换子字符串。
也许做美丽的汤和正则表达的组合? (不确定这是否是一个好的和有效的想法。)
答案 0 :(得分:2)
只需从attrib
映射中删除该属性即可;假设您在局部变量<span>
中引用了span
标记:
if span.has_key('id'):
del span['id']
演示:
>>> soup = BeautifulSoup('<span id="internal-source-marker_0.9510186333209276"></span>')
>>> span = soup.find('span')
>>> span
<span id="internal-source-marker_0.9510186333209276"></span>
>>> if span.has_key('id'):
... del span['id']
...
>>> span
<span></span>