我正在尝试登录某个服务器并以编程方式从那里下载图片。我知道登录,我能够获得哪些变量是用户名和密码。我也可以使用此代码下载不需要密码的图片。
网页一直告诉我我的用户代理不受支持,因此我假设我设置的用户代理不正确。
它需要cookie和用户代理。我知道如何使用cookie登录页面,但我不知道如何在Python中将User-agent参数添加到HTTP请求中(并检查它是否已正确添加)。
我正在构建标准的url opener。我正在使用此代码:
def login(_url, _name, _password):
if 1:
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor())
opener.addheaders = {("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:5.0) Gecko/20100101 Firefox/5.0")}
urllib2.install_opener(opener)
#
# login parameters
# PRE:
# 1] addons.mozilla.org/en-US/firefox/addon/live-http-headers/
# 2] _url is first line, sometimes it ends with do-submit, php...
# 3] _name and _password is content
# SOURCE:
# http://www.oooff.com/php-scripts/basic-curl-form-filling-tutorial/php-newbie-form-fill-tutorial.php
#
else:
#
# i tried even mechanize
# but I do not know how to set it either
#
cookies = mechanize.CookieJar()
opener = mechanize.build_opener(mechanize.HTTPCookieProcessor(cookies))
params = urllib.urlencode(dict(login=_name, password=_password))
f = opener.open(_url, params)
data = f.read()
f.close()
return opener
我试图将adheaders移动到不同的地方,但它没有帮助。也许它可以通过机械化完成,但我不确定如何。
感谢您的帮助。 :)
答案 0 :(得分:1)
python docs页面具有使用方括号构建开启者的这种格式。你将它传递给{(...)}
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
opener.open('http://www.example.com/')