如何使用Python请求登录此特定网站?

时间:2017-08-16 15:57:17

标签: python forms login python-requests

我正在尝试使用以下请求登录此网站,但它不起作用

  

Cookie永远不会包含' userid'。

我应该改变什么?我是否需要在帖子请求中添加标题?

import requests

payload = {
    'ctl00$MasterMainContent$LoginCtrl$Username': 'myemail@email.com',
    'ctl00$MasterMainContent$LoginCtrl$Password': 'mypassword',
    'ctl00$MasterMainContent$LoginCtrl$cbxRememberMe' : 'on',
}

with requests.Session() as s:
    login_page = s.get('http://www.bentekenergy.com/')
    response = s.post('http://benport.bentekenergy.com/Login.aspx', data=payload)
    if 'userid' in response.cookies:
       print("connected")
    else:
       print("not connected")

编辑1(以下评论): 我不知道在请求标题中放入了什么,下面是我尝试过的,但没有成功。

request_headers = {
    'Accept':'image/webp,image/*,*/*;q=0.8',
    'Accept-Encoding':'gzip, deflate, sdch, br',
    'Accept-Language':'en-US,en;q=0.8',
    'Connection':'keep-alive',
    'Cookie':'ACOOKIE=C8ctADJmMTc1YTRhLTBiMTEtNGViOC1iZjE0LTM5NTNkZDVmMDc1YwAAAAABAAAASGYBALlflFnvWZRZAQAAAABLAAC5X5RZ71mUWQAAAAA-',
    'Host':'statse.webtrendslive.com',
    'Referer':'https://benport.bentekenergy.com/Login.aspx',
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}

编辑2(关于stovfl回答):

我现在使用以下有效负载,使用表单中的值填充每个属性,并使用用户名,密码和rememberMe完成它。 我还尝试在请求中使用以下标头。 仍未连接

payload = {
    '__VIEWSTATE' : '',
    '__VIEWSTATEGENERATOR' : '',
    '__PREVIOUSPAGE' : '',
    '__EVENTVALIDATION' : '',
    'isAuthenticated' : 'False',
    'ctl00$hfAccessKey' : '',
    'ctl00$hfVisibility' : '',
    'ctl00$hfDateTime' : '',
    'ctl00$hfHash' : '',
    'ctl00$hfAnnouncementsUrl' : '',
    'ctl00$MasterMainContent$LoginCtrl$Username' : '',
    'ctl00$MasterMainContent$LoginCtrl$Password' : '',
    'ctl00$MasterMainContent$LoginCtrl$cbxRememberMe' : '',
}

request_headers = {
        'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
        'Accept-Encoding':'gzip, deflate, br',
        'Accept-Language':'en-US,en;q=0.8',
        'Cache-Control':'max-age=0',
        'Connection':'keep-alive',
        'Content-Length':'7522',
        'Content-Type':'application/x-www-form-urlencoded',
        'Cookie':'',
        'Host':'benport.bentekenergy.com',
        'Origin':'https://benport.bentekenergy.com',
        'Referer':'https://benport.bentekenergy.com/Login.aspx',
        'Upgrade-Insecure-Requests':'1',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}

with requests.Session() as s:
response = s.get('http://benport.bentekenergy.com/Login.aspx')
soup = BeautifulSoup(response.text, "html.parser")
if soup.find("input", {"name" : "ctl00$MasterMainContent$LoginCtrl$Username"}):
    print("not connected")
    soup = BeautifulSoup(response.text, "lxml")
    for element in soup.select("input"): 
       if element.get("name") in payload:
           payload[element.get("name")] = element.get("value")

    payload['ctl00$MasterMainContent$LoginCtrl$Username'] = 'myemail@email.com'
    payload['ctl00$MasterMainContent$LoginCtrl$Password'] = 'mypassword'
    payload['ctl00$MasterMainContent$LoginCtrl$cbxRememberMe'] = 'on'

    response = s.post('http://benport.bentekenergy.com/Login.aspx', data=payload, headers=request_headers)

    print (s.cookies)
    soup = BeautifulSoup(response.text, "html.parser")
    if soup.find("input", {"name" : "ctl00$MasterMainContent$LoginCtrl$Username"}):
            print("not connected")
    else:
            print("connected")

s.cookies包含:

<RequestsCookieJar[<Cookie BenportState=q1k2r2eqftltjm55igy5mg55 for .bentekenergy.com/>, <Cookie RememberMe=True for .bentekenergy.com/>]>

编辑3(回答!):

我添加了

'__EVENTTARGET' : ''

在有效负载中并用值&c; ctl00 $ MasterMainContent $ LoginCtrl $ btnSignIn&#39;

填充它

现在我联系了! 注意:标题不是必需的,只是有效负载

1 个答案:

答案 0 :(得分:1)

  

评论:...发现有一个参数'__EVENTTARGET'不在有效负载中。它需要包含'ctl00 $ MasterMainContent $ LoginCtrl $ btnSignIn'。现在我联系了!

是的,忽略了Submit Button,有一个Javascript

href="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions(&quot;ctl00$headerLoginCtrl$btnSignIn&quot;,

相关:SO Answer How To see POST Data

  

评论:...根据您的回答(编辑2)。仍未连接

  1. 您使用http代替https
    将自动重定向到https

  2. <RequestsCookieJar已发生变化,因此取得了一些进展 我仍然不确定您的身份验证检查:if soup.find("input", {"name"... 你有检查页面内容吗?
    有错误信息吗?

  3. 请勿使用BeautifulSoup(...您的以下请求应使用Session s重新使用已分配的Cookie。 例如。 response = s.get('<url to some resticted page>

  4. 仅使用 request_headers

  5. 尝试'User-Agent'
      

    分析&lt; form&gt;
      登录网址:https://benport.bentekenergy.com/Login.aspx
      表单:操作:/Login.aspx,方法:post

    如果value empty表示:登录页面中的预设值

     1:input type:hidden   value:/wEPDwUKLT... id:__VIEWSTATE 
     2:input type:hidden   value:0BA31D5D      id:__VIEWSTATEGENERATOR 
     3:input type:hidden   value:2gILTn0H1S... id:__PREVIOUSPAGE 
     4:input type:hidden   value:/wEWDAKIr6... id:__EVENTVALIDATION 
     5:input type:hidden   value:False         id:isAuthenticated 
     6:input type:hidden   value:nu66O9eqvE    id:ctl00_hfAccessKey 
     7:input type:hidden   value:public        id:ctl00_hfVisibility 
     8:input type:hidden   value:08%2F16%2F... id:ctl00_hfDateTime 
     9:input type:hidden   value:3AB353573D... id:ctl00_hfHash 
    10:input type:hidden   value://announce... id:ctl00_hfAnnouncementsUrl 
    11:input type:text     value:empty         id:ctl00_MasterMainContent_LoginCtrl_Username 
    12:input type:password value:empty         id:ctl00_MasterMainContent_LoginCtrl_Password 
    13:input type:checkbox value:empty         id:ctl00_MasterMainContent_LoginCtrl_cbxRememberMe