我想从公司门户网站中抓取结果。看来我公司的Intranet门户使用ping SSO登录。
因此,当我尝试登录时,并不需要输入用户名和密码。当我转到链接https://portal.mycompany.com时,它会指向https://ping-sso.mycompany.com/idp/ ...,然后重定向到https://portal.mycompany.com
如何使用python登录网站并抓取结果?
我尝试使用请求直接登录,但出现以下错误
r = requests.get("https://mycompanyintranetportal.com/home",
verify="C:/Users/me/AppData/Local/Programs/Python/Python37/webscrapping/Lib/site-packages/certifi/cacert.pem")
SSLError:HTTPSConnectionPool(host ='mycompanyintranetportal.com',port = 443): 网址超出了最大重试次数:/ home(由SSLError(SSLError(“ bad 握手:错误([('SSL例程','tls_process_server_certificate', '证书验证失败')])“)))
发现的一件好事是,我能够访问mycompany门户的ping SSO。
requests.get("https://ping-mycompanyintranetportal.com/idp/ZGgWP/resumeSAML21/idp/SSO.ping")
有人可以帮我吗?