关于使用请求登录网站的另一个问题

时间:2020-08-13 03:19:47

标签: python-3.x beautifulsoup python-requests

我被困住了。在尝试从登录页面首次登录后,我尝试着找到每个使用Python 3的Requests库访问网页的示例。这里的缺点是,我正在尝试创建一个工作工具,因此无法提供指向所使用的确切网页的链接,但可以显示该页面中的源代码以提供帮助。希望有人可以告诉我我在这里提供的东西需要做什么?

我认为我坚持的是,有一个名为“ __RequestVerificationToken”的隐藏输入,该输入随每次新登录页面加载/刷新而动态变化,我知道这需要“发布” ”和登录凭据,但是到目前为止,我看过的每个教程都按以下步骤进行操作:

  1. 使用Requests和BS4首先访问并解析登录页面的源代码,并找到唯一的令牌值
  2. 使用该唯一令牌值发送发布请求

但问题是(我认为),这两个请求之间的令牌值发生了变化,从而使第一个请求过时了。

页面凭据部分的源代码(以及我不确定是否需要某种加密功能,但无论如何都包含了它)如下所示。它运行时没有“错误”,但登录后我要访问的页面看起来与登录页面代码相同,表示登录未成功:

[![Login_Creds] [1]] [1]

<form action="/Login" id="form-login" method="post"><input name="__RequestVerificationToken" type="hidden" value="3s5_lA2VJBP3XTpl_YE3zkxcZarbGUuCZfHbm0oJ3nvQweIKorZXnein-YBQnrouX9VVLVc0qw2gvOVIE8-IxLdd9kALEFVpb4RA4z1Ed7k1" />    <div id="message-sessionexpired" class="usermessage-login ui-widget-content ui-corner-all h-column" style="display: none">
        <div class="v-column first">
            <i class="ci-icon-info-sign ci-icon" id="128824"></i>
        </div>
        <div class="v-column last">
            We thought you left, so for your security we signed you out.
Please sign back in below.
        </div>
    </div>
    <div id="message-userloggedout" class="usermessage-login ui-widget-content ui-corner-all h-column" style="display: none">
        <div class="v-column first">
            <i class="ci-icon-info-sign ci-icon table-cell" id="128825"></i>
        </div>
        <div class="v-column last">
            You signed in with a different user in a new tab.
Please use the new tab or sign back in below.
        </div>
    </div>
    <table>
        <tr>
            <td>
                <label for="login-email">User Name (email)</label>
            </td>
            <td>
                <input class="input-login" id="login-email" name="email" type="text" value="" />
            </td>
        </tr>
        <tr>
            <td>
                <label for="login-password">Password</label>
            </td>
            <td>
                <input autocomplete="on" class="ci-textbox input-login" id="login-password" name="password" type="password" value="" />
            </td>
        </tr>
        <tr>
            <td colspan="2" style="text-align: center">
                <input id="login-passhash" name="passhash" type="hidden" value="" />
            </td>
        </tr>
        <tr>
            <td colspan="2" style="text-align: right">

                <button class="ci-button" id="button-login" title="Version 4.4.86.17690" type="submit" value="Login">Login<script for="button-login" temporary="true" type="text/javascript">button_login=new Button("#button-login",{disabled:!1});$(function(){button_login.init();$("#button-login").off("click.centralui");$("#button-login").on("click.centralui",function(n){$(this).is(":disabled")||n.isDefaultPrevented()||$("#form-login").loader().show({message:"",focusInput:!1});$(this).is(":disabled")||n.isDefaultPrevented()||encryptPassword()})})</script></button>
            </td>
        </tr>
        <tr>
            <td colspan="2">
                <a class="smaller" href="/ResetPassword?Length=5" id="link-forgotpassword">Forgot your password?</a>
            </td>
        </tr>
        <tr>
            <td colspan="2">
            </td>
        </tr>
    </table>
    <br />
<div class="validation-summary-valid" data-valmsg-summary="true"><ul><li style="display:none"></li>
</ul></div></form>
<script type="text/javascript">
    $(function () {
        if (sessionStorage.expired == "true") {
            $("#message-sessionexpired").css("display", "flex");
            sessionStorage.expired = false;
        }
        if (sessionStorage.userLoggedOut == "true") {
            $("#message-userloggedout").css("display", "flex");
            sessionStorage.userLoggedOut = false;
        }
    });

    function encryptPassword() {
        var clearPass = $("#login-password").val();
        $("#login-passhash").val(null);

        var publicKeyExponent = Base64.decode("EXPONENT_STRING_HERE");
        if (publicKeyExponent != false) {

            var publicKeyModulus = Base64.decode("DECODE_STRING_IS_HERE");
            var publicKey = new RSAPublicKey(publicKeyModulus, publicKeyExponent);
            var encryptedPass = RSA.encrypt(clearPass, publicKey);

            $("#login-passhash").val(encryptedPass);
            $("#login-password").val(null);
        }
    }
</script>

到目前为止,我尝试过的代码是:

import requests
from bs4 import BeautifulSoup

USERNAME = 'USERNAME'
PASSWORD = 'PASSWORD'

LOGIN_URL = "BASEURL/Login" # /Login from the "<form action" part of login source code
PRIVATE_URL = "BASEURL/PAGE_AFTER_LOGIN"

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/IP_HERE Safari/537.36'}

def main():
    sess = requests.session()

    # Get login "hidden_token" first
    html = sess.get(LOGIN_URL)
    soup = BeautifulSoup(html.content,'html.parser')
    hidden_token = soup.find('input', {'name': '__RequestVerificationToken'}).get('value')
    
    # Create payload
    payload = {
        "username": USERNAME, 
        "password": PASSWORD, 
        "__RequestVerificationToken": hidden_token
    }

    # Perform login
    html = sess.post(LOGIN_URL, data=payload, headers=headers)

    # Scrape url
    html = sess.get(PRIVATE_URL, headers=headers)
    print(html) # Response
    print(html.text) # Source Code for after logged in page

if __name__ == '__main__':
    main()

给定这些数据,除了使用硒之外,还有什么可以尝试的想法?同样,我无法提供确切的URL,只是在寻找一些指导。谢谢!

更新 经过一番挖掘之后,事实证明,我的猜想是正确的,当我从第一个“ get”请求和“ post”请求中打印出cookie时,“ __ RequestVerificationToken”是不同的。那么,有什么方法可以通过“ post”命令提交令牌值吗? [1]:https://i.stack.imgur.com/85yAO.png

1 个答案:

答案 0 :(得分:1)

我想您对令牌在请求之间更改这一事实的预感是正确的。 最有可能基于cookie生成一个新令牌。如果服务器看到一个新用户(也就是一个新的会话cookie),它将生成另一个__RequestVerificationToken

每种登录方式都不同,但是我建议您尝试以下操作

GET(login_url)  ->   extract cookies from response object,  extract __RequestVerificationToken

POST(login_url, data = (user, passw, token), cookies = extracted_cookies) -> extract cookies again

当您发布具有相同Cookie的请求时,也许服务器不会更改令牌。

登录后,再次提取cookie并进行比较。 (有时服务器会在您登录后 后分配一组新的Cookie)。祝你好运!

相关问题