我要分开的信息来自:https://deathsnacks.com/wf/(提醒)
使用inspect元素可以看到类名是:list-group alerts-container
所以我到目前为止得到了这段代码:
url = "https://deathsnacks.com/wf/"
req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
html = urllib.request.urlopen(req).read()
soup = BeautifulSoup(html)
alert = soup.find('ul', {'class': 'list-group alerts-container'}).text
msg = "```"
msg += alert
msg += "```"
但是,上面的输出给出了当前可用警报的所有行,但不是单独行(或单独行),我怎么能分开它们。
输出:
答案 0 :(得分:1)
从它的外观来看,你从汤中检索的HTML是
<ul class="list-group alerts-container">
<li class="list-group-item"> ... </li>
<li class="list-group-item"> ... </li>
<li class="list-group-item"> ... </li>
</ul>
要单独检索所有这些项目,您应使用soup.find_all('li')
。这将返回列表中的各个项目。
alert = soup.find('ul', {'class': 'list-group alerts-container'})
items = alert.find_all('li')
msg = '```\n'
msg += '\n'.join(e.text for e in items)
msg += '\n```'