Question

我正在尝试从url获取href，将其放入列表并打印出列表中的一个。例如第三个，但我得到的只是每个href的第三个字符。

import urllib
from bs4 import BeautifulSoup

newlist=[]
page = urllib.urlopen("http://python-data.drchuck.net/known_by_Kamran.html").read()
soup = BeautifulSoup(page, "html.parser")
tags = soup.find_all('a')
for tag in tags:
    newlist=tag.get("href", None)
    print newlist[2]

输出是： Ť Ť Ť Ť Ť Ť 吨...

Answer 1

以下正确打印所有href。

import urllib
from bs4 import BeautifulSoup

newlist=[]
page = urllib.urlopen("http://www.django-rest-framework.org/api-guide/throttling/#how-clients-are-identified").read()
soup = BeautifulSoup(page, "html.parser")
tags = soup.find_all('a', href=True)
for tag in tags:
    print tag['href']

PS：您提到的网页无法访问，因此我使用了不同的网页。

Beautifulsoup获得多个hrefs

1 个答案: