我正在尝试使用Python在Web应用程序上进行一些抓取,以从中提取信息,并且受HTTPBasicAuth
保护。
到目前为止,这是我的代码:
from lxml import html
import requests
from requests.auth import HTTPBasicAuth
headers = { 'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:67.0) Gecko/20100101 Firefox/67.0' }
page = requests.get('https://10.0.0.1:999/app/info' , verify = False , auth = ('user' , 'pass'), headers = headers)
print (page.content.decode())
但是我从print (page.content.decode())
得到了这个答案:
<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<title>400 - Bad Request</title>
</head>
<body>
<h1>400 - Bad Request</h1>
</body>
</html>
可能缺少什么?
答案 0 :(得分:0)
显然我在使用HTTPBasicAuth
,而我不得不使用HTTPDigestAuth
。即使该网站似乎正在使用基本身份验证,但在使用Burp Proxy检查流量后,我注意到它正在使用摘要身份验证。