我写了这样的代码:
>>> import re
>>> url='<a href="C:\python34\koala.jpg">jpg</a><font size="10">'
>>> print(re.findall('href="(.*?)"><',url))
我除了结果
C:\python34\koala.jpg">jpg</a
但我只能看到这个结果:
[]
为什么会这样?
我不知道为什么我在控制台中有这个结果 请帮帮我 我使用的是python 3.4和windows8.1。
答案 0 :(得分:2)
您确定也想要>jpg</a
部分。如果是,那么你可以使用它:
>>> re.findall('href="([^"]*">[^<]*</a)',url)
['C:\\python34\\koala.jpg">jpg</a']
如果您只需要href
属性值,则可以使用:
>>> re.findall('href="([^"]*")',url)
['C:\\python34\\koala.jpg"']