Question

我有这个HTML

b>Source: </b> <a href=\'http: //website.com/ml/datasets/Iris\'>text here</a><br><p class="normal">Creator: R.A. Fisher
<br><br>Donor: Namehere <b>\'@\'</b> website.com</u>)</p>

我想使用正则表达式删除多个 

我正在使用此_str = re.sub(' \s*',' ',_str)

但它返回字符串，完全没有变化。

如果我使用相同的正则表达式但指定了不同的替换字符，那么它可以正常工作，_str = re.sub(' \s*','',_str)

Answer 1

你只是在 之后删除空格。您可以改为使用肯定前瞻来删除紧跟其他 的所有 ：

re.sub(r'<br>(?=<br>)', '', _str)

您可以使用以下内容处理 个空格

re.sub(r'<br>(?=\s*<br>)', '', _str)

Python re.sub没有按预期工作

1 个答案: