示例:
<div class="label">Employee Count</div>
<div class="field">331,000</div>
如何使用漂亮的汤(或不同的python库)在HTML文件中搜索“员工数量”,然后返回紧随其后的值(331,000)?
使用
result = soup.body.find(text='Employee Count')
我可以找到员工数,但我怎么能在它之后立即返回该字段?
答案 0 :(得分:0)
使用div
文字查找Employee Count
元素并获取next sibling:
soup.find('div', text='Employee Count').find_next_sibling().text
演示:
>>> from bs4 import BeautifulSoup
>>> data = """
... <body>
... <div class="label">Employee Count</div>
... <div class="field">331,000</div>
... </body>
... """
>>>
>>> soup = BeautifulSoup(data)
>>> soup.find('div', text='Employee Count').find_next_sibling().text
331,000