Python:替换字符串

时间:2013-09-10 02:24:30

标签: python html regex

我正在浏览页面,我想修改包含

的行
<span class="font16"></span>

如何更正以下代码?

text = re.sub(r'<span class="font(.*)"></span><span', r'<span class="font\1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; </span><span', text)

1 个答案:

答案 0 :(得分:1)

模式.*将匹配任何内容,直到行尾,因此匹配将如下所示:

16"></span>....

这不是你想要的。使用在第一个"处停止的模式(因为在"引用的属性值中不允许使用这些模式):

r'<span class="font([^"]+)"></span><span'