我一直在阅读Python的urllib2打开和读取受密码保护的目录的能力,但即使在查看文档中的示例之后,在StackOverflow上,我也无法让我的脚本工作。
import urllib2
# Create an OpenerDirector with support for Basic HTTP Authentication...
auth_handler = urllib2.HTTPBasicAuthHandler()
auth_handler.add_password(realm=None,
uri='https://webfiles.duke.edu/',
user='someUserName',
passwd='thisIsntMyRealPassword')
opener = urllib2.build_opener(auth_handler)
# ...and install it globally so it can be used with urlopen.
urllib2.install_opener(opener)
socks = urllib2.urlopen('https://webfiles.duke.edu/?path=/afs/acpub/users/a')
print socks.read()
socks.close()
当我打印内容时,它会打印登录屏幕的内容,我正在尝试打开的URL会将您重定向到。有谁知道这是为什么?
答案 0 :(得分:3)
auth_handler
仅适用于基本HTTP身份验证。此处的网站包含HTML表单,因此您需要将您的用户名/密码作为POST数据提交。
我建议您使用mechanize
模块来简化您的登录。
快速举例:
import mechanize
browser = mechanize.Browser()
browser.open('https://webfiles.duke.edu/?path=/afs/acpub/users/a')
browser.select_form(nr=0)
browser.form['user'] = 'username'
browser.form['pass'] = 'password'
req = browser.submit()
print req.read()