BeautifulSoup查找类包含一些特定的单词

时间:2019-02-21 09:00:40

标签: web-scraping beautifulsoup

我到处寻找有关如何查找名称包含一个单词的类的信息,但我找不到。我想从以单词页脚命名的类中获取信息。

<div class="footerinfo"> <span class="footerinfo__header"> </span> </div>

<div class="footer">
    <div class="w-container container-footer">
    </div>
</div>

我已经尝试过了,但是还是不起作用

soup.find_all('div',class_='^footer^'):

 soup.find_all('div',class_='footer*'):

有人对此有任何想法吗?

1 个答案:

答案 0 :(得分:1)

您可以使用CSS选择器,该选择器允许您根据特定属性的内容选择元素。这包括用于包含的选择器* =。

for ele in soup.select('div[class*="footer"]'):
    print (ele)

或正则表达式

import re

regex = re.compile('.*footer.*')
soup.find_all("div", {"class" : regex})