我知道要从字符串中删除所有html标记,可以使用:
string = re.sub('<[^<]*?/?>', '', string)
但无论如何我只能删除锚标签并保留所有其他标签。例如:
<p>Some text<a href="#">link</a></p>
成为:
<p>Some text link</p>
答案 0 :(得分:3)
答案 1 :(得分:0)
感谢revo,它完美无缺。 我还设法使用此正则表达式修复此问题
string = re.sub('<a.*?>|</a> ', '', string)