Question

我正在尝试从div标签提取文本。`

我的代码：

import requests
from bs4 import BeautifulSoup
url='url'
page = requests.get(url,'lxml')
soup = BeautifulSoup(page.content)
print(soup.find('div',{'class':'meta-

item salary'}).text)

HTML代码：

  <div class="meta-item salary">
        <span
            class="icon icon-pound-currency-3"></span> $1000 - $2000 per annum + + excellent benefits    </div>

结果我有： “优秀包装”仅无数值。我无能为力。

Answer 1

您可以使用

soup.select_one('.icon-pound-currency-3').text

或以下，使用化合物中的单个类

html  = '''

<div class="meta-item salary">
        <span
            class="icon icon-pound-currency-3"></span> $1000 - $2000 per annum + + excellent benefits    </div>
'''
soup = BeautifulSoup(html, 'lxml')
print(soup.find('div',{'class':'salary'}).text)

如果可以有多个匹配项，则需要findAll或汤。选择并迭代返回的列表。位置匹配可能是可能的，但需要查看html页面。

没有从div标签获取全文.BeautifulSoup.Python

1 个答案: