我正在尝试使用a
获取所有链接class=fl
我正在使用mechanize来获取原始html输出,然后使用beautifulsoup来尝试解析链接。
rawGatheredGoogleOutput
的值输出类似(只是谷歌搜索结果):
红色部分是为了向您展示我想要抓取的内容,即a.fl
答案 0 :(得分:1)
要查找具有a
属性的class=fl
元素,请按以下方式调用find_all
:
getAdditionalGooglePages = beautifulSoupObj.find_all('a', attrs={"class": "fl"})
对于其他属性,它更简单 - 例如,使用id=fl
它将是:
getAdditionalGooglePages = beautifulSoupObj.find_all('a', id="fl")
...但这不适用于class
,因为它是Python保留字。