BeautifulSoup重复链接如下

时间:2016-12-10 19:19:05

标签: python web-scraping beautifulsoup

我正在尝试使用Python中的BeautifulSoup库解析网站。因为我必须重复遵循一个起始链接。

输入:开始链接排名计数

考虑具有n个锚标签的网页(< a href ="">)。使用起始链接,我必须找到指定位置值的链接。

从那里我必须重复上面的步骤计数次。我必须返回最后一个元素

import urllib
from BeautifulSoup import *
#start_link=input("\nEnter the starting point\n")
start_link='http://python-data.dr-chuck.net/known_by_Janae.html'

def get_last_link(link,position):
    temp_variable=urllib.urlopen(link).read()
    soup_variable=BeautifulSoup(temp_variable)
    tags_variable=soup_variable('a')
    t=tags_variable[position].get('href',None)
    return t

def loop(link,times,i):
    #link=start_link
    while i<times:
        temp=get_last_link(link,7)
        i+=1
        print temp
        loop(temp,times,i)

loop(start_link,18,0)

帮我解释一下这段代码。

1 个答案:

答案 0 :(得分:0)

在最后一个循环之后休息一下。