Python:分离同一个类的多个(来自html)

时间:2017-05-18 14:11:07

标签: python discord discord.py

我要分开的信息来自:https://deathsnacks.com/wf/(提醒)

使用inspect元素可以看到类名是:list-group alerts-container

所以我到目前为止得到了这段代码:

url = "https://deathsnacks.com/wf/"
    req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
    html = urllib.request.urlopen(req).read()
    soup = BeautifulSoup(html)
    alert = soup.find('ul', {'class': 'list-group alerts-container'}).text
    msg = "```"
    msg += alert
    msg += "```"

但是,上面的输出给出了当前可用警报的所有行,但不是单独行(或单独行),我怎么能分开它们。

输出:

looks like this

1 个答案:

答案 0 :(得分:1)

从它的外观来看,你从汤中检索的HTML是

<ul class="list-group alerts-container">
    <li class="list-group-item"> ... </li>
    <li class="list-group-item"> ... </li>
    <li class="list-group-item"> ... </li>
</ul>

要单独检索所有这些项目,您应使用soup.find_all('li')。这将返回列表中的各个项目。

alert = soup.find('ul', {'class': 'list-group alerts-container'})
items = alert.find_all('li')
msg = '```\n'
msg += '\n'.join(e.text for e in items)
msg += '\n```'