我正在尝试从url获取href,将其放入列表并打印出列表中的一个。例如第三个,但我得到的只是每个href的第三个字符。
import urllib
from bs4 import BeautifulSoup
newlist=[]
page = urllib.urlopen("http://python-data.drchuck.net/known_by_Kamran.html").read()
soup = BeautifulSoup(page, "html.parser")
tags = soup.find_all('a')
for tag in tags:
newlist=tag.get("href", None)
print newlist[2]
输出是: Ť Ť Ť Ť Ť Ť 吨...
答案 0 :(得分:-1)
以下正确打印所有href
。
import urllib
from bs4 import BeautifulSoup
newlist=[]
page = urllib.urlopen("http://www.django-rest-framework.org/api-guide/throttling/#how-clients-are-identified").read()
soup = BeautifulSoup(page, "html.parser")
tags = soup.find_all('a', href=True)
for tag in tags:
print tag['href']
PS:您提到的网页无法访问,因此我使用了不同的网页。