如何使用beautifulsoup排除内部标签

时间:2019-10-05 17:35:11

标签: python beautifulsoup

嘿,我目前正在尝试通过一个网站进行解析,但是我差不多完成了,但是有一个小问题。我想从html代码中排除内部标签

<span class="moto-color5_5">
  <strong>Text 1 </strong>
  <span style="font-size:8px;">Text 2</span>
</span>

我尝试使用 ... find("span", "moto-color5_5"),但这返回

文本1文本2 而不是只返回文本1

有什么建议吗?

特别:)

1 个答案:

答案 0 :(得分:0)

排除内部标签也将排除Text 1,因为它位于内部标签<strong>中。

不过,您可以在当前汤中找到strong

html = """<span class="moto-color5_5">
  <strong>Text 1 </strong>
  <span style="font-size:8px;">Text 2</span>
</span>
"""
soup = BeautifulSoup(html)
result = soup.find("span", "moto-color5_5").find('strong')
print(result.text) # Text 1