我是python和BeautifulSoup的新手。我正试图刮一个印度新闻网站。由于限制,我使用BeautifulSoup 3和python 2。我试图抓的网站是http://www.madhyamam.com/kerala。
我有兴趣提取下面提到的2个div标签。
<div class="col-xs-12"></div>
<div class="col-lg-12 col-md-12 col-sm-12 col-xs-8"></div>
我根据stackoverflow中的一些帖子尝试了以下选项。
feedArtList = mySoup.findAll('div', {'class' : 'col-lg-12 col-md-12 col-sm-12 col-xs-8', 'class' : 'col-xs-12'})
# Returns only the div tags for col-xs-12
feedArtList = mySoup.findAll('div', {'class' : re.compile('col-lg-12 col-md-12 col-sm-12 col-xs-8' | 'col-xs-12')})
# Returned an error "TypeError: unsupported operand type(s) for |: 'str' and 'str'"
感谢有人可以帮助我解决问题或提供有关如何解决的指示。