我从网站上抓取了一些HTML
<div>
<div id="content1">
</div>
<div id="content3">
</div>
<div id="content22">
</div>
</div>
如何迭代ID为content
的所有DIV?
答案 0 :(得分:2)
最简单的方法是使用CSS selector:
soup.select('div[id^=content]')
^=
语法指定id
属性值应以<{1}} 开始。
您可以使用regular expression filter作为element.find_all()
的content
参数传入相同的结果:
id
演示:
import re
soup.find_all('div', id=re.compile('^content'))