我正在尝试使用Python中的BeautifulSoup库解析网站。因为我必须重复遵循一个起始链接。
输入:开始链接,排名和计数
考虑具有n个锚标签的网页(< a href ="">)。使用起始链接,我必须找到指定位置值的链接。
从那里我必须重复上面的步骤计数次。我必须返回最后一个元素
import urllib
from BeautifulSoup import *
#start_link=input("\nEnter the starting point\n")
start_link='http://python-data.dr-chuck.net/known_by_Janae.html'
def get_last_link(link,position):
temp_variable=urllib.urlopen(link).read()
soup_variable=BeautifulSoup(temp_variable)
tags_variable=soup_variable('a')
t=tags_variable[position].get('href',None)
return t
def loop(link,times,i):
#link=start_link
while i<times:
temp=get_last_link(link,7)
i+=1
print temp
loop(temp,times,i)
loop(start_link,18,0)
帮我解释一下这段代码。
答案 0 :(得分:0)
在最后一个循环之后休息一下。