def get_add(soup):
add_list=soup.findAll(attrs={"class":"jaddt"})
#add_list = [i.find('a') for i in add_soup]
add=[i.text for i in add_list]
print add
return add
现在的问题是,
我想解析来自.html页面的数据,其中属性为" class":" jaddt" ,其中包含" href" /例如" ....阅读更多"
目前正在使用beautifulsoup,但它只是解析上面的类数据,我想解析来自" href"的数据。链接甚至!
任何人都可以帮助我吗?
我的意思是,我想解析并从href中提取信息,主要问题是,对象是绕过href