使用BeatifulSoup从属性中提取href并保存到.xls

时间:2014-05-24 09:53:20

标签: python parsing beautifulsoup web-crawler

def get_add(soup):
    add_list=soup.findAll(attrs={"class":"jaddt"})
    #add_list = [i.find('a') for i in add_soup]
    add=[i.text for i in add_list]
    print add
    return add  

现在的问题是,

我想解析来自.html页面的数据,其中属性为" class":" jaddt" ,其中包含" href" /例如" ....阅读更多"

目前正在使用beautifulsoup,但它只是解析上面的类数据,我想解析来自" href"的数据。链接甚至!

任何人都可以帮助我吗?

我的意思是,我想解析并从href中提取信息,主要问题是,对象是绕过href

0 个答案:

没有答案