我想从下表中突出显示的表中获取信息。
如果我使用BeautifulSoup 3,我可以使用它然后我可以抓住表格,然后用它提取信息,但是如果我使用BeautifulSoup 4则不能。我为BS3工作的代码是:
from BeautifulSoup import BeautifulSoup as bs
soup = bs (open("information.html"))
table = soup.find("table", {"color":"#000000"})
print table
当我打印表时,它将打印该表中的内容(它也是唯一一个颜色为#000000的表)。
对于BS4,我有:
from bs4 import BeautifulSoup as bs
soup = bs (open("information.html"))
table = soup.find("table", {"color":"#000000"})
print table
但所有打印的内容都是None
或[]
。我厌倦了将find改为find_all并找到了所有,但这并没有帮助。我也尝试在{}之前添加attrs=
(我在另一个SO问题上看到了它)。
如果我使用table = soup.find("table", {"width":"#000000"})
在第一个表中执行soup.find,则返回第一个表。我怎样才能抓住我想要的桌子?