我有一些我正在看的BeautifulSoup。在这种情况下,我的树看起来像这样:
soup = "<table class="myTable"><tr>...</tr></table>"
当我致电以下时间时:
soup.findAll(attrs={'class':'myTable'})
当我希望返回顶级标记时,我没有返回任何内容。但是,如果我正在搜索的标签不在顶层,如下所示:
soup = "<body><table class="myTable"><tr>...</tr></table></body>"
然后我找到了桌子。我想我错过了一些明显的东西。如果我不是,有没有办法找到包括顶级标签在内的所有内容?
答案 0 :(得分:1)
我无法重现这个问题。我认为找到顶级标签应该有效:
In [92]: import BeautifulSoup
In [94]: soup=BeautifulSoup.BeautifulSoup('<table class="myTable"><tr>...</tr></table>')
In [95]: soup.findAll(attrs={'class':'myTable'})
Out[95]: [<table class="myTable"><tr>...</tr></table>]