使用BeautifulSoup查找顶级标签

时间:2011-08-21 21:38:37

标签: python beautifulsoup

我有一些我正在看的BeautifulSoup。在这种情况下,我的树看起来像这样:

soup = "<table class="myTable"><tr>...</tr></table>"

当我致电以下时间时:

soup.findAll(attrs={'class':'myTable'})

当我希望返回顶级标记时,​​我没有返回任何内容。但是,如果我正在搜索的标签不在顶层,如下所示:

soup = "<body><table class="myTable"><tr>...</tr></table></body>"

然后我找到了桌子。我想我错过了一些明显的东西。如果我不是,有没有办法找到包括顶级标签在内的所有内容?

1 个答案:

答案 0 :(得分:1)

我无法重现这个问题。我认为找到顶级标签应该有效:

In [92]: import BeautifulSoup
In [94]: soup=BeautifulSoup.BeautifulSoup('<table class="myTable"><tr>...</tr></table>')

In [95]: soup.findAll(attrs={'class':'myTable'})
Out[95]: [<table class="myTable"><tr>...</tr></table>]