BeautifulSoup Python Web抓取缺少的HTML主体

时间:2020-03-27 23:33:02

标签: python-3.x web-scraping beautifulsoup

我正在使用Beutifull汤来抓取此网页:https://greyhoundbet.racingpost.com//#results-dog/race_id=1765914&dog_id=527442&r_date=2020-03-19&track_id=61&r_time=11:03

结果:我得到了JavaScript Css

所需的输出:我需要主html

我使用了这段代码

pk=3

2 个答案:

答案 0 :(得分:0)

我认为您要寻找的是这个

page = requests.get(url)

soup = BeautifulSoup(page.text, 'html.parser')

它将包含页面中包含html标签的文本

答案 1 :(得分:0)

恐怕您将无法使用BeautifulSoup直接获取它,因为页面加载后,然后javascript加载了数据。

这是组件的局限性之一,您可能需要使用硒。

请检查关于此question

的答案