我想知道是否可以检查beautifulsoup对象中的最后一个html标记。这是代码。
try:
f = urllib.request.urlopen('http://www.taylor-enviro.com' + link)
soup = BeautifulSoup(f)
except Exception as e:
print (e)
if len(soup.find_all("td",{"class":"pages"})) > 0:
print('pages true')
pagelinkrow = soup.find("td",{"class":"pages"})
if len(pagelinkrow.find_all("li")) > 0:
print('litrue')
for pagelinkrow1 in pagelinkrow.findAll('li'):
try:
print('intry')
pagelink = pagelinkrow1.a['href']
if pagelink not in linklist:
linklist.append(pagelink)
print (pagelink)
return pagelink
found = 'done'
except Exception as e:
print(e)
我想查看最后一次' li'。
答案 0 :(得分:1)
pagelinkrow.find_all("li")
返回li
元素数组。您可以使用索引-1
获取该数组的最后一项:
pagelinkrow.find_all("li")[-1]