嘿,我目前正在尝试通过一个网站进行解析,但是我差不多完成了,但是有一个小问题。我想从html代码中排除内部标签
<span class="moto-color5_5">
<strong>Text 1 </strong>
<span style="font-size:8px;">Text 2</span>
</span>
我尝试使用
... find("span", "moto-color5_5")
,但这返回
文本1文本2 而不是只返回文本1
有什么建议吗?
特别:)
答案 0 :(得分:0)
排除内部标签也将排除Text 1
,因为它位于内部标签<strong>
中。
不过,您可以在当前汤中找到strong
:
html = """<span class="moto-color5_5">
<strong>Text 1 </strong>
<span style="font-size:8px;">Text 2</span>
</span>
"""
soup = BeautifulSoup(html)
result = soup.find("span", "moto-color5_5").find('strong')
print(result.text) # Text 1