使用Pythons Mechanize从网站提取数据的问题

时间:2014-08-25 12:56:34

标签: python parsing session-cookies mechanize user-agent

因此,我试图从足球统计网站中提取一些数据,以创建我自己的幻想足球排名今年。我成功使用mechanize来填写身份验证表单并进入网站。但是,当我在页面中阅读时,网站上显示的数据不存在,我知道身份验证有效。例如,如果我查看页面源代码,所有数据都在那里......但是当我"登录"通过机械化并在页面中读取,带有数据的区域就是空的..

更具体地说,我希望通过迭代"侧栏容器"来定位玩家,提取/打开他们的特定统计页面。位于以下代码的网址中...

然而,机械化读取数据并将其返回整个"侧栏容器"是空的。

我的代码代码发布在下面:

import mechanize

br = mechanize.Browser()
br.set_handle_robots(False)
br.addheaders = [('User-agent', 'Firefox')]
br.set_handle_robots(False)
br.open("https://www.profootballfocus.com/sample/by_player.php?tab=by_player&season=2008&surn=B&playerid=&group=")
br.select_form('login')
br.form['amember_login'] = 'insert your username'
br.form['amember_pass'] = 'insert your password'
response = br.submit()
print response.read()

该网站是www.profootballfocus.com。在这个例子中,我创建了一个帐户来尝试从2008开始搜索免费样本数据(代码中的url具有我试图定位的直接URL)。任何帮助或指示表示赞赏!感谢

0 个答案:

没有答案