我需要一个可以输入以下内容的程序:
<a href="/events/python-events/past/" title="">
Python事件存档
并输出:
/events/python-events/past/
我尝试使用get('href')
和python3
来beautifulSoup4
答案 0 :(得分:0)
正如documentation所说:
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')
soup.find_all('a')
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
# <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
# <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
for link in soup.find_all('a'):
print(link.get('href'))
# http://example.com/elsie
# http://example.com/lacie
# http://example.com/tillie
只需将html_doc
赋予其HTML解析器即可。
您可以从html_doc
或requests
模块中获得urllib.request
。