无法使用请求登录网站

时间:2017-11-10 04:29:41

标签: python post get python-requests

为了好玩,我正在尝试使用Python请求登录我学校的学生门户网站。这是我到目前为止所提出的。我试图在标题上非常明确,因为我得到一个200状态代码(无法登录时也会得到的代码)而不是302(成功登录)。

import sys
import os
import requests

def login(username, password):
    url = '(link)/home.html#sign-in-content'
    values = {
        'translator_username' : '',
        'translator_password' : '',
        'translator_ldappassword' : '',
        'returnUrl' : '',
        'serviceName' : 'PS Parent Portal',
        'serviceTicket' : '',
        'pcasServerUrl' : '\/',
        'credentialType' : 'User Id and Password Credential',
        'account' : username,
        'pw' : password,
        'translatorpw' : password
    }

    headers = {
        'accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
        'accept-encoding' : 'gzip, deflate, br',
        'accept-language' : 'en-US,en;q=0.9',
        'cache-control' : 'max-age=0',
        'connection' : 'keep-alive',
        'content-type' : 'application/x-www-form-urlencoded',
        'host' : '(link)',
        'origin' : '(link)',
        'referer' : '(link)guardian/home.html',
        'upgrade-insecure-requests' : '1'
    }

    with requests.Session() as s:
        p = s.post(url, data=values)
        if p.status_code == 302:
            print(p.text)
        print('Authentication error', p.status_code)

        r = s.get('(link)guardian/home.html')
        print(r.text)

def main():
    login('myname', 'mypass')

if __name__ == '__main__':
    main()

使用Chrome检查网络请求,除了长Cookie编号,内容长度和用户代理外,所有这些标头都位于“请求标头”下。

表格如下:

pstoken:(token)
contextData:(text)
translator_username:
translator_password:
translator_ldappassword:
returnUrl:(url)guardian/home.html
serviceName:PS Parent Portal
serviceTicket:
pcasServerUrl:\/
credentialType:User Id and Password Credential
account:f
pw:(id)
translatorpw:

我错过了标题/表单名称的内容吗?这是饼干的问题吗?

如果我查看p.requests.headers,这就是发送内容:

{'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.89 Safari/537.36', 'accept-encoding': 'gzip, deflate, br', 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8', 'connection': 'keep-alive', 'accept-language': 'en-US,en;q=0.9', 'cache-control': 'max-age=0', 'content-type': 'application/x-www-form-urlencoded', 'host': '(url)', 'origin': '(url)', 'referer': '(url)guardian/home.html', 'upgrade-insecure-requests': '1', 'Content-Length': '263'}

p.text为我提供了登录页面的HTML

使用PowerAPI,请求,Mechanize和RoboBrowser进行测试。一切都失败了。

1 个答案:

答案 0 :(得分:0)

您期望得到什么回应?您使用错误的方法来分析您的回复。

with requests.Session() as s:
    p = s.post(url, data=values)
    if p.status_code == 302:
        print(p.text)
    print('Authentication error', p.status_code)

    r = s.get('(link)guardian/home.html')
    print(r.text)

在您的代码中,您打印Authentication error忽略status_code,我认为至少应该这样:

with requests.Session() as s:
    p = s.post(url, data=values)
    if p.status_code == 302:
        print(p.text)
        r = s.get('(link)guardian/home.html')
        print(r.text)
    else:
        print('Authentication error', p.status_code)