使用Python 3和BeautifulSoup 4转到下一页

时间:2013-06-07 20:04:49

标签: python beautifulsoup

我正在尝试使用Python 3和BeautifulSoup 4从网站的多个页面上的表中解析数据。除了一些页面具有超出页面长度的表格外,一切都运行良好。该页面仅显示20个条目,要获取其他条目,需要单击表格底部的“下一个”以移至下一个表格数据继续的页面。 我尝试使用

nextPage = re.compile(b'Next</a>')

nextPageUrl = nextPage.findall(webContent)

我知道这不是BeautifulSoup。我试过这个因为我不知道如何使用BeutifulSoup这样做。但是,它不起作用。有人可以帮助我,并建议我如何让下一页的网址继续刮?感谢您提供的任何建议。

1 个答案:

答案 0 :(得分:0)

soup = BeautifulSoup(webContent)
a = soup.find('a', href=True, text=re.compile("Next"))
if a:
    link = a["href"]