正则表达式非ASCII字符

时间:2012-11-29 18:48:06

标签: python regex

我在python中使用正则表达式时遇到了一些麻烦。 html字符串是:

html = <td style="padding-right:5px;">
<span class="blackText">Above £ 7.00 = </span>
</td>
<td>
<span class="blackText">
<p>Free</p>
</span>
</td>

我想提取“7.00”和“免费”,但以下内容不起作用:

  

amount = re.findall(r'Above£(。*?)=',html)

Python为£符号抛出非ASCII错误。我怎么能绕过这个?感谢。

1 个答案:

答案 0 :(得分:5)

amount = re.findall(r'Above \xC2 (.*?) =', html)