我尝试从以下HTML中提取“ li”:
我这样尝试过:
soup = BeautifulSoup(html, 'html.parser')
containers = soup.find('div', {'class': 'pagination-container'}).find('ul')`
containers.li
但是我没有得到预期的结果。 有人可以帮我吗?
答案 0 :(得分:0)
soup.find_all('li')[0]
用于搜索页面上的所有li,0为其建立索引。
soup.find_all('span', class_='ad')
搜索带有广告类的跨度
我的跨度包含许多其他跨度的数据,我想摆脱这些数据,并且我知道我在和之间搜索这个特定词
Artist = soup.find_all('h1')[0]
Artist = re.search('<h1>(.*)<span', str(Artist))
Artist = Artist.group(0)
Artist = str(Artist).replace('<h1>','')
Artist = str(Artist).replace('<span','')
我没有提出更好的建议,但是它确实起作用了。我也很乐意提出建议:)