BeautifulSoup 3找到具有不同属性的标签

时间:2016-10-09 12:03:43

标签: python-2.7 beautifulsoup

我是python和BeautifulSoup的新手。我正试图刮一个印度新闻网站。由于限制,我使用BeautifulSoup 3和python 2。我试图抓的网站是http://www.madhyamam.com/kerala

我有兴趣提取下面提到的2个div标签。

<div class="col-xs-12"></div>
<div class="col-lg-12 col-md-12 col-sm-12 col-xs-8"></div>

我根据stackoverflow中的一些帖子尝试了以下选项。

feedArtList = mySoup.findAll('div', {'class' : 'col-lg-12 col-md-12 col-sm-12 col-xs-8', 'class' : 'col-xs-12'})
# Returns only the div tags for col-xs-12

feedArtList = mySoup.findAll('div', {'class' : re.compile('col-lg-12 col-md-12 col-sm-12 col-xs-8' | 'col-xs-12')})
# Returned an error "TypeError: unsupported operand type(s) for |: 'str' and 'str'"

感谢有人可以帮助我解决问题或提供有关如何解决的指示。

0 个答案:

没有答案