登录到不使用Python请求模块的网页

时间:2013-10-18 08:48:27

标签: python html login python-requests

我正在尝试使用Python请求模块对网站进行身份验证,然后从中检索一些信息。这是页面的登录部分:

<div>

    <label class="label-left" for="username"> … </label>
    <input id="username" class="inputbox" type="text" size="18" alt="username" name="username"></input>

</div>
<div>

    <label class="label-left" for="passwd"> … </label>
    <input id="passwd" class="inputbox" type="password" alt="password" size="18" name="passwd"></input>

</div>
<div> … </div>
<div class="readon">

    <input class="button" type="submit" value="Login" name="Submit"></input>    

我现在正在做的是:

payload = {
    'username': username,
    'passwd': password,
    'Submit':'Login'
}

with requests.Session() as s:
    s.post(login, data=payload)
    ans = s.get(url)
    print ans.text

问题是,即使在身份验证之后,我也会获得相同的登录页面。响应代码是200,所以一切都应该没问题。我错过了什么吗?


更新

感谢评论,我已经分析了帖子请求,我看到有一些隐藏的参数。其中,有一些参数的值在不同的请求之间变化。出于这个原因,我只是使用BeautifulSoup获取它们,然后更新post请求的有效负载,如下所示:

with requests.Session() as s:

    login_page = s.get(login)
    soup = BeautifulSoup(login_page.text)
    inputs = soup.findAll(name='input',type='hidden')

    for el in inputs:
        name = el['name']
        value = el['value']
        payload[name]=value

    s.post(login, data=payload)
    ans = s.get(url)

尽管如此,我仍然在登录页面。可能还有其他一些影响因素吗?

0 个答案:

没有答案