使用正则表达式从字符串中过滤值

时间:2012-09-05 18:45:08

标签: python regex

我正在尝试使用正则表达式过滤字符串中的值,例如过滤掉<a href=""/>标记中的网址。

<a href="http://www.example.com">

我浏览了re库,应该匹配字符串的正则表达式

r'<a href="(.*)">'

现在将这个值保存到变量中的最佳方法是什么?

1 个答案:

答案 0 :(得分:2)

你不应该用正则表达式解析html,但是因为你说的只是一个例子......
如果您希望总能找到匹配项:

try:
    foo = re.search(r'<a href="(.*)">', text).group(1)
except AttributeError:
    foo = None

如果您不知道它是否匹配:

match = re.search(r'<a href="(.*)">', text)
if match:
    foo = match.group(1)
else:
    foo = None