Question

我正在尝试使用正则表达式过滤字符串中的值，例如过滤掉<a href=""/>标记中的网址。

<a href="http://www.example.com">

我浏览了re库，应该匹配字符串的正则表达式

r'<a href="(.*)">'

现在将这个值保存到变量中的最佳方法是什么？

Answer 1

你不应该用正则表达式解析html，但是因为你说的只是一个例子......
如果您希望总能找到匹配项：

try:
    foo = re.search(r'<a href="(.*)">', text).group(1)
except AttributeError:
    foo = None

如果您不知道它是否匹配：

match = re.search(r'<a href="(.*)">', text)
if match:
    foo = match.group(1)
else:
    foo = None