beautifulsoup findAll find_all

时间:2012-09-09 13:08:01

标签: python xml-parsing html-parsing beautifulsoup

我想用Python解析一个html文件,我使用的模块是beautifulsoup。

使用它之后,发生了一些奇怪的事情。据说函数“find_all”是

与“findAll”相同,但我已尝试过两者。但它是不同的。

有人可以告诉我不同​​的吗?

import urllib, urllib2, cookielib
from BeautifulSoup import *
site = "http://share.dmhy.org/topics/list?keyword=TARI+TARI+team_id%3A407"

rqstr = urllib2.Request(site)
rq = urllib2.urlopen(rqstr)
fchData = rq.read()

soup = BeautifulSoup(fchData)

t = soup.findAll('tr')
print t

1 个答案:

答案 0 :(得分:4)

来自BeautifulSoup源代码的

http://bazaar.launchpad.net/~leonardr/beautifulsoup/bs4/view/head:/bs4/element.py#L1260

def find_all(self, name=None, attrs={}, recursive=True, text=None,
                 limit=None, **kwargs):
# ...
# ...

findAll = find_all       # BS3
findChildren = find_all  # BS2