Question

我想从ul中提取数据，这个ul在div内部等等。我用lxml完成了它，但现在我想用漂亮的汤来尝试它

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0'}

url = "https://linkedin.com/company/1005"

r = requests.get(url, headers=headers)
print(r.text)

soup = BeautifulSoup(r.text, 'html.parser')

div = soup.find_all('div', class_="basic-info-description")
print div

Answer 1

尝试：

lis_nodiz

Answer 2

您可以在找到的bs对象上再次使用find（All）：

ul = soup.findAll('div', attrs={'class':'basic-info-about'}).find('ul')

上述代码的缺点是，如果第一个div不在html代码中，则会引发错误。更好的是：

divs = soup.findAll(''div', attrs={'class':'basic-info-about'}')
for div in divs:
    ul = div.find('ul')

BeautifulSoup在div的div中提取数据

2 个答案: