Question

我试图通过Python访问此网站，首先需要登录： https://nitrogensports.eu/

到目前为止，这是我的脚本：

from bs4 import BeautifulSoup
import requests, urllib, html5lib

url = 'https://nitrogensports.eu/'
user_agent = {'User-Agent' : 'Mozilla/5.0'}
response = requests.get(url, headers = user_agent)

这给了我：

<Response [503]>

我之前通过检查用户名和密码框的元素登录了网站，但是我没有，但我甚至无法获得该网站的第一个HTML树。我尝试过其他一些事情，例如将我的user_agent更改为：

user_agent = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64;en; rv:5.0) Gecko/20110619 Firefox/5.0'

但我一直得到503

有人可以帮我检索网页的HTML结构而不用密码用户名吗？感谢

Answer 1

我发现这可行，但必须只是登录页面

from bs4 import BeautifulSoup
import urllib3

url = 'https://nitrogensports.eu/'

http = urllib3.PoolManager()

response = http.request('GET', url)

soup = BeautifulSoup(response.data, 'lxml')

你仍然需要登录我确定我已经登录了之前没有需要经历所有这些我的一些旧工作，看看我是否能找到它。检查元素，但是之前也是这样做的。

对于其余代码，此website可能有助于此方法。

在请求中请求[503]并且用户代理不起作用

1 个答案: