Python:检查最后一个html标记

时间:2017-06-14 20:12:49

标签: python web-scraping beautifulsoup

我想知道是否可以检查beautifulsoup对象中的最后一个html标记。这是代码。

try:
    f = urllib.request.urlopen('http://www.taylor-enviro.com' + link)
    soup = BeautifulSoup(f)
except Exception as e:
    print (e)

if len(soup.find_all("td",{"class":"pages"})) > 0:
    print('pages true')
    pagelinkrow = soup.find("td",{"class":"pages"})
    if len(pagelinkrow.find_all("li")) > 0:
        print('litrue')
        for pagelinkrow1 in pagelinkrow.findAll('li'):
            try:
                print('intry')
                pagelink = pagelinkrow1.a['href']
                if pagelink not in linklist:
                    linklist.append(pagelink)
                    print (pagelink)
                return pagelink

                found = 'done'
            except Exception as e:
                        print(e)

我想查看最后一次' li'。

1 个答案:

答案 0 :(得分:1)

pagelinkrow.find_all("li")返回li元素数组。您可以使用索引-1获取该数组的最后一项:

pagelinkrow.find_all("li")[-1]