Python BeautifulSoup-在<ul class =“”>中找到特定的<li>

时间:2018-10-23 18:27:26

标签: python web-scraping beautifulsoup

我尝试从以下HTML中提取“ li”:

enter image description here

我这样尝试过:

soup = BeautifulSoup(html, 'html.parser')
containers = soup.find('div', {'class': 'pagination-container'}).find('ul')`
containers.li

但是我没有得到预期的结果。 有人可以帮我吗?

1 个答案:

答案 0 :(得分:0)

soup.find_all('li')[0]

用于搜索页面上的所有li,0为其建立索引。

soup.find_all('span', class_='ad')

搜索带有广告类的跨度

我的跨度包含许多其他跨度的数据,我想摆脱这些数据,并且我知道我在和之间搜索这个特定词

Artist = soup.find_all('h1')[0]
Artist = re.search('<h1>(.*)<span', str(Artist))
Artist = Artist.group(0)
Artist = str(Artist).replace('<h1>','')
Artist = str(Artist).replace('<span','')

我没有提出更好的建议,但是它确实起作用了。我也很乐意提出建议:)