在BeautifulSoup中使用至少一个类提取div

时间:2010-02-20 18:18:40

标签: html css beautifulsoup

假设您有一个包含大量此内容的网页:

<div class="story cid-8797378263432 l-es headline-story thumbnail-true">

其中cid-nnnnnnnnnnnn类可以变化。你会如何通过BeautifulSoup获得所有div?

我试过了:

soup.find('div', {'class': 'story'})

但这不起作用。似乎只用故事类来寻找div。

2 个答案:

答案 0 :(得分:0)

这是一个错误:Launchpad bug report。该报告还包含一个解决方法:

soup.findAll('div', {'class': re.compile(r'\bstory\b')})

答案 1 :(得分:0)

或者您可以使用似乎没有该错误的soup.findAll('div', 'story')