如何访问没有id的<div class =“”>中的文本?使用BeauitfulSoup

时间:2016-02-04 04:01:54

标签: python web-scraping beautifulsoup

下面灰色区域是我试图在页面中提取的一些文本。

我不知道如何访问灰色区域中的文本。我试过以下但是没有用。该类没有id - 如何在其中获取文本?

comment = soup.find("div", {"class",  "GCARQJCDEXD"})

enter image description here

1 个答案:

答案 0 :(得分:1)

您可以通过class属性与空字符串匹配来找到元素

from bs4 import BeautifulSoup

data = """
<div class="GCARQJCDEXD">
    <div class="clearfix hidden">something here</div>
    <div class>
        desired text
    </div>
</div>
"""
soup = BeautifulSoup(data, "html.parser")

comment = soup.find("div", {"class": "GCARQJCDEXD"}).find("div", {"class": ""})
print(comment.get_text(strip=True))

打印desired text