有没有办法获得没有标签的href链接?

时间:2018-12-29 14:33:44

标签: python-3.x beautifulsoup

我需要一个可以输入以下内容的程序: <a href="/events/python-events/past/" title=""> Python事件存档 并输出: /events/python-events/past/

我尝试使用get('href')python3beautifulSoup4

1 个答案:

答案 0 :(得分:0)

正如documentation所说:

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')

soup.find_all('a')
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

for link in soup.find_all('a'):
    print(link.get('href'))
# http://example.com/elsie
# http://example.com/lacie
# http://example.com/tillie

只需将html_doc赋予其HTML解析器即可。

您可以从html_docrequests模块中获得urllib.request