BeautifulSoup / Python / HTML - 在特定的div类之后立即返回div类

时间:2015-03-30 01:20:09

标签: python html beautifulsoup

示例:

<div class="label">Employee Count</div>
<div class="field">331,000</div>

如何使用漂亮的汤(或不同的python库)在HTML文件中搜索“员工数量”,然后返回紧随其后的值(331,000)?

使用

result = soup.body.find(text='Employee Count')

我可以找到员工数,但我怎么能在它之后立即返回该字段?

1 个答案:

答案 0 :(得分:0)

使用div文字查找Employee Count元素并获取next sibling

soup.find('div', text='Employee Count').find_next_sibling().text

演示:

>>> from bs4 import BeautifulSoup
>>> data = """
... <body>
... <div class="label">Employee Count</div>
... <div class="field">331,000</div>
... </body>
... """
>>> 
>>> soup = BeautifulSoup(data)
>>> soup.find('div', text='Employee Count').find_next_sibling().text
331,000