下面灰色区域是我试图在页面中提取的一些文本。
我不知道如何访问灰色区域中的文本。我试过以下但是没有用。该类没有id - 如何在其中获取文本?
comment = soup.find("div", {"class", "GCARQJCDEXD"})
答案 0 :(得分:1)
您可以通过将class
属性与空字符串匹配来找到元素:
from bs4 import BeautifulSoup
data = """
<div class="GCARQJCDEXD">
<div class="clearfix hidden">something here</div>
<div class>
desired text
</div>
</div>
"""
soup = BeautifulSoup(data, "html.parser")
comment = soup.find("div", {"class": "GCARQJCDEXD"}).find("div", {"class": ""})
print(comment.get_text(strip=True))
打印desired text
。