我的html页面有:
...
<table class="t1" ..>
<tr><td> ... <a href="">...</a> ... <a href="">..</a>
</table>
...
我有:
html = BeautifulSoup(page)
links = html.findAll('a', ?????????)
如何查找此表中的所有链接?
答案 0 :(得分:5)
找到表格(在这种情况下为by class),然后找到其中的所有链接。
html = BeautifulSoup(page)
table = html.find('table', 't1')
links = table.findAll('a')
答案 1 :(得分:1)
比原始查找更有效,请使用SoupStrainer
:
html = BeautifulSoup(page, parseOnlyThese=SoupStrainer('table', 't1' ) )
links = html.findAll('a')
答案 2 :(得分:0)
这应返回页面中的链接列表
html = BeautifulSoup(page)
links = html.findAll('a')