我正在尝试使用正则表达式过滤字符串中的值,例如过滤掉<a href=""/>
标记中的网址。
<a href="http://www.example.com">
我浏览了re库,应该匹配字符串的正则表达式
r'<a href="(.*)">'
现在将这个值保存到变量中的最佳方法是什么?
答案 0 :(得分:2)
你不应该用正则表达式解析html,但是因为你说的只是一个例子......
如果您希望总能找到匹配项:
try:
foo = re.search(r'<a href="(.*)">', text).group(1)
except AttributeError:
foo = None
如果您不知道它是否匹配:
match = re.search(r'<a href="(.*)">', text)
if match:
foo = match.group(1)
else:
foo = None