我正试图从2016年赛季的MLB.com中获取球员统计数据。我在Python中使用Beautiful Soup,我需要在这里看到的表中提取信息:
以下是我的尝试:
r=requests.get(url)
soup=BeautifulSoup(r.content,'html.parser')
gdata=soup.find_all('div',{'id':'datagrid'})
print(gdata)
这应该返回标记中的所有子标记,但它不会。这导致以下结果:
[<div id="datagrid"></div>]
任何人都可以解释为什么这不会产生表的内容?此外,我该怎么做才能访问表的内容?
由于
答案 0 :(得分:0)
如果您查看网页的来源,看起来datagrid
div实际上是空的&amp;统计信息以this URL的json动态插入。也许你可以使用它。为了解决这个问题,我查看了页面来源,看到div没有孩子,然后使用Chrome开发人员工具网络标签查找提取数据的请求:
xml
,将搜索结果范围缩小到可能包含数据的请求