我在Python中使用beautifulsoup包搜索一个html文件。现在我想找到以下标签:
<b>Particulate Matter (PM <sub>2.5</sub> ) [µ/m<sup>3</sup>] level in 2010 was </b>
我怎么能这样做?
我试过用
soup.find(text=re.compile("Particulate Matter"))
这将返回我不想要的其他标签。这个标签的相同词语是“Particulate Matter”,“2.5”,“2010年的水平”
答案 0 :(得分:0)
你试过这个吗?
soup.find(lambda tag: tag.name == 'b' and
"Particulate Matter" in tag.text)