Web抓取 - 使用BeautifulSoup和Python从类中获取文本?

时间:2017-08-01 23:58:22

标签: python web-scraping beautifulsoup

我想从网站上删除文字(“显示650结果”)。

我正在寻找的结果是:

 Result : Showing 650 results

以下是Html代码:

<div class="jobs-search-results__count-sort pt3">
            <div class="jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4">
                Showing 650 results
            </div>

Python代码:

    response = requests.get(index_url)
    soup = BeautifulSoup(response.text, 'html.parser')
    text = {}
    link = "jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4" 
    for div in soup.find_all('div',attrs={"class" : link}):
        text[div.text]
    text

到目前为止看起来我的代码无效。

1 个答案:

答案 0 :(得分:3)

  1. 如果您只查找一个元素,则不需要soup.find_allsoup.find也适用

  2. 您可以使用tag.string / tag.contents / tag.text访问内部文字

  3. div = soup.find('div', {"class" : link})
    text = div.string