我如何用美丽的汤匙刮取没有类别或ID的元素

时间:2019-08-29 16:11:06

标签: python web-scraping beautifulsoup

我正在尝试使用漂亮的汤料在此网站http://www.singaporepools.com.sg/en/product/Pages/toto_results.aspx上为“下一个大奖”筹集资金,但我目前很难拿到1,000,000。

我目前正在阅读这本书:用python自动化无聊的东西。我已经花了将近2个小时来阅读在线教程和这里的过去问题,但是我仍然无法弄清楚如何针对大多数教程显示的没有类或id的元素进行

import requests, bs4
res=requests.get('http://www.singaporepools.com.sg/en/product/Pages/toto_results.aspx')
res.raise_for_status()
noStarchSoup = bs4.BeautifulSoup(res.text, "html.parser")
elems = noStarchSoup.find('span', {'style':'color'}, {'style':'font-weight'})

1 个答案:

答案 0 :(得分:0)

如果您转到“网络”标签,则会在下面的网址中找到。

http://www.singaporepools.com.sg/DataFileArchive/Lottery/Output/toto_next_draw_estimate_en.html?v=2019y8m29d17h15m

使用以下代码检索该值。

import requests, bs4
import re
res=requests.get('http://www.singaporepools.com.sg/DataFileArchive/Lottery/Output/toto_next_draw_estimate_en.html?v=2019y8m29d17h15m')
res.raise_for_status()
noStarchSoup = bs4.BeautifulSoup(res.text, "html.parser")
elems = noStarchSoup.find('div',text=re.compile('Next Jackpot')).find_next('span')
print(elems.text)

输出:

$1,000,000 est