我正在尝试使用BeautifulSoup抓取此网页https://www.whoscored.com/Statistics,以便获取玩家统计信息表的所有信息。我遇到很多困难,想知道是否有人可以帮助我。
url = 'https://www.whoscored.com/Statistics'
html = requests.get(url).content
soup = BeautifulSoup(html, "lxml")
text = [element.text for element in soup.find_all('div' {'id':"statistics-table-summary"})]
我的问题在于我不知道获取该表的正确标记是什么。桌子上还有几页,我想刮每一页。我看到表格中页面更改的唯一指示是以下代码中的数字:
<div id="statistics-table-summary" class="" data-fwsc="11">