查找表格中的所有链接

时间:2011-02-09 02:59:42

标签: python beautifulsoup

我的html页面有:

...
<table class="t1" ..>
<tr><td> ... <a href="">...</a> ... <a href="">..</a>
</table>

...

我有:

html = BeautifulSoup(page)

links = html.findAll('a', ?????????)

如何查找此表中的所有链接?

3 个答案:

答案 0 :(得分:5)

找到表格(在这种情况下为by class),然后找到其中的所有链接。

html = BeautifulSoup(page)
table = html.find('table', 't1')
links = table.findAll('a')

答案 1 :(得分:1)

比原始查找更有效,请使用SoupStrainer

html  = BeautifulSoup(page, parseOnlyThese=SoupStrainer('table', 't1' ) )
links = html.findAll('a')

另请参阅Search by Class documentation

答案 2 :(得分:0)

这应返回页面中的链接列表

html = BeautifulSoup(page)
links = html.findAll('a')