所以我试图从这个网站抓取幻想播放器数据:http://www.footywire.com/。作为示例页面,我将参考这个:http://www.footywire.com/afl/footy/pu-gold-coast-suns--gary-jnr-ablett。
遗憾的是,我使用BeautifulSoup的努力没有取得积极成果。到目前为止,它似乎只在页面的左侧呈现菜单,而中间没有任何东西(2016年Supercoach统计数据和盈亏平衡分析)让我真正刮掉。
import urllib
from bs4 import BeautifulSoup
r = urllib.urlopen('http://www.footywire.com/afl/footy/pu-gold-coast-suns--gary-jnr-ablett').read()
soup = BeautifulSoup(r)
print soup.prettify()
我哪里出错了,或者我需要调整什么才能获得我追踪的统计数据?
编辑:在与@Padraic Cunningham进行快速讨论后,我确定问题特别是在执行BeautifulSoup(r)命令时,结果输出不如r本身就包含在其中。