Beautifulsoup获得多个hrefs

时间:2016-10-08 12:32:19

标签: python beautifulsoup href

我正在尝试从url获取href,将其放入列表并打印出列表中的一个。例如第三个,但我得到的只是每个href的第三个字符。

import urllib
from bs4 import BeautifulSoup

newlist=[]
page = urllib.urlopen("http://python-data.drchuck.net/known_by_Kamran.html").read()
soup = BeautifulSoup(page, "html.parser")
tags = soup.find_all('a')
for tag in tags:
    newlist=tag.get("href", None)
    print newlist[2]

输出是: Ť Ť Ť Ť Ť Ť 吨...

1 个答案:

答案 0 :(得分:-1)

以下正确打印所有href

import urllib
from bs4 import BeautifulSoup

newlist=[]
page = urllib.urlopen("http://www.django-rest-framework.org/api-guide/throttling/#how-clients-are-identified").read()
soup = BeautifulSoup(page, "html.parser")
tags = soup.find_all('a', href=True)
for tag in tags:
    print tag['href']

PS:您提到的网页无法访问,因此我使用了不同的网页。