python BeautifulSoup仅抓取“文本格式”子级

时间:2019-01-09 17:19:34

标签: python beautifulsoup

HTML看起来像:

<div class="Title">
        SIZE
        <span class="required-option-group">
                (required)
        </span>
</div>

我的代码是:name = soup.find('div', {'class':'Title'}).text.strip()。 它既返回“ SIZE”又返回“((必需)”),但我只想获取“ SIZE”。

我相信这是一种非常简单的方法,只是想知道是否有人可以帮助我。

谢谢!

1 个答案:

答案 0 :(得分:2)

您可以使用另一个.find(text=True)

隔离标签的直接文本
from bs4 import BeautifulSoup
html="""
<div class="Title">
        SIZE
        <span class="required-option-group">
                (required)
        </span>
</div>
"""
soup=BeautifulSoup(html,'html.parser')
print(soup.find('div', {'class':'Title'}).find(text=True).strip())

输出

SIZE