没有从div标签获取全文.BeautifulSoup.Python

时间:2019-03-14 21:36:18

标签: python web-scraping beautifulsoup

我正在尝试从div标签提取文本。`

我的代码:

import requests
from bs4 import BeautifulSoup
url='url'
page = requests.get(url,'lxml')
soup = BeautifulSoup(page.content)
print(soup.find('div',{'class':'meta-

item salary'}).text)

HTML代码:

  <div class="meta-item salary">
        <span
            class="icon icon-pound-currency-3"></span> $1000 - $2000 per annum + + excellent benefits    </div>

结果我有:  “优秀包装”仅无数值。我无能为力。

1 个答案:

答案 0 :(得分:0)

您可以使用

soup.select_one('.icon-pound-currency-3').text

或以下,使用化合物中的单个类

html  = '''

<div class="meta-item salary">
        <span
            class="icon icon-pound-currency-3"></span> $1000 - $2000 per annum + + excellent benefits    </div>
'''
soup = BeautifulSoup(html, 'lxml')
print(soup.find('div',{'class':'salary'}).text)

如果可以有多个匹配项,则需要findAll或汤。选择并迭代返回的列表。位置匹配可能是可能的,但需要查看html页面。