Selenium和Beautifulsoup的Python抓取仅提取超链接href没有链接

时间:2020-09-14 05:56:16

标签: python selenium web-scraping beautifulsoup

我试图用他们的超链接URL抓取NBA球员,但是无论我如何尝试,都只会导致href名称和数字,以任何方式从超链接中提取URL,谢谢。

enter image description here

enter image description here

1 个答案:

答案 0 :(得分:0)

页面上的href链接是相对链接。拔出这些链接时,将它们存储在列表中,然后遍历这些链接,并将网页的网址放在这些链接之前。

https://stats.nba.com/player/1628960/网址为您提供了某个玩家的信息,但您的href列表中只有/player/1628960/。这意味着您需要在列表中的每个条目之前加上https://stats.nba.com

您可以尝试以下

url = 'https://stats.nba.com'
new_links = []
for link in player list:
    new_links.append(url + link)

或者您可以在抓取这些链接时在URL前面添加

相关问题