Question

我要分开的信息来自：https://deathsnacks.com/wf/（提醒）

使用inspect元素可以看到类名是：list-group alerts-container

所以我到目前为止得到了这段代码：

url = "https://deathsnacks.com/wf/"
    req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
    html = urllib.request.urlopen(req).read()
    soup = BeautifulSoup(html)
    alert = soup.find('ul', {'class': 'list-group alerts-container'}).text
    msg = "```"
    msg += alert
    msg += "```"

但是，上面的输出给出了当前可用警报的所有行，但不是单独行（或单独行），我怎么能分开它们。

输出：

Answer 1

从它的外观来看，你从汤中检索的HTML是

<ul class="list-group alerts-container">
    <li class="list-group-item"> ... </li>
    <li class="list-group-item"> ... </li>
    <li class="list-group-item"> ... </li>
</ul>

要单独检索所有这些项目，您应使用soup.find_all('li')。这将返回列表中的各个项目。

alert = soup.find('ul', {'class': 'list-group alerts-container'})
items = alert.find_all('li')
msg = '```\n'
msg += '\n'.join(e.text for e in items)
msg += '\n```'

Python：分离同一个类的多个（来自html）

1 个答案: