BeautifulSoup Django Parse for Links

时间:2013-08-14 23:15:01

标签: python django parsing beautifulsoup

我正在尝试使用a获取所有链接class=fl我正在使用mechanize来获取原始html输出,然后使用beautifulsoup来尝试解析链接。

rawGatheredGoogleOutput的值输出类似(只是谷歌搜索结果): 红色部分是为了向您展示我想要抓取的内容,即a.fl

1 个答案:

答案 0 :(得分:1)

要查找具有a属性的class=fl元素,请按以下方式调用find_all

getAdditionalGooglePages = beautifulSoupObj.find_all('a', attrs={"class": "fl"})

对于其他属性,它更简单 - 例如,使用id=fl它将是:

getAdditionalGooglePages = beautifulSoupObj.find_all('a', id="fl")

...但这不适用于class,因为它是Python保留字。