考虑代码:
from bs4 import BeautifulSoup
from urllib.request import urlopen
content = urlopen('https://example.net/users/101')
soup = BeautifulSoup(content)
divTag = soup.find_all("div", {"class":"classname"})
print(divTag)
for tag in divTag:
ulTags = tag.find_all("ul", {"class":"classname"})
for tag in ulTags:
aTags = tag.find_all("li")
for tag in aTags:
name = tag.find('a')['href']
print(name)
如果我使用,
content = open("try.html","r")
我得到了所需的输出。
此处,只有在输入用户名和密码后才能访问example.net。密码。虽然解析是正确完成的,但上面的代码不会打印任何内容。如何将会话cookie值添加到此代码中?
答案 0 :(得分:4)
您是否尝试过请求?
可以在会话中保留Cookie。
import requests
s = requests.Session()
s.post('https://example.net/users/101', data = {'username' : 'sup', 'password' : 'pass'})
r = s.get("https://example.net/users/101")
soup = BeautifulSoup(r.text)
有关requests.Session()的更多信息