应用错误收集

def get_add(soup):
    add_list=soup.findAll(attrs={"class":"jaddt"})
    #add_list = [i.find('a') for i in add_soup]
    add=[i.text for i in add_list]
    print add
    return add

现在的问题是，

我想解析来自.html页面的数据，其中属性为＆＃34; class＆＃34;：＆＃34; jaddt＆＃34; ，其中包含＆＃34; href＆＃34; /例如＆＃34; ....阅读更多＆＃34;

目前正在使用beautifulsoup，但它只是解析上面的类数据，我想解析来自＆＃34; href＆＃34;的数据。链接甚至！

任何人都可以帮助我吗？

我的意思是，我想解析并从href中提取信息，主要问题是，对象是绕过href

使用BeatifulSoup从属性中提取href并保存到.xls

0 个答案: