如何使用cookie和用户代理登录网页?

时间:2011-07-01 18:49:10

标签: python cookies login download user-agent

我正在尝试登录某个服务器并以编程方式从那里下载图片。我知道登录,我能够获得哪些变量是用户名和密码。我也可以使用此代码下载不需要密码的图片。

网页一直告诉我我的用户代理不受支持,因此我假设我设置的用户代理不正确。

它需要cookie和用户代理。我知道如何使用cookie登录页面,但我不知道如何在Python中将User-agent参数添加到HTTP请求中(并检查它是否已正确添加)。

我正在构建标准的url opener。我正在使用此代码:

def login(_url, _name, _password):
    if 1:
        opener = urllib2.build_opener(urllib2.HTTPCookieProcessor())
        opener.addheaders = {("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:5.0) Gecko/20100101 Firefox/5.0")}
        urllib2.install_opener(opener)
        #
        # login parameters
        # PRE:
        #     1] addons.mozilla.org/en-US/firefox/addon/live-http-headers/
        #    2] _url is first line, sometimes it ends with do-submit, php...
        #    3] _name and _password is content
        # SOURCE:
        # http://www.oooff.com/php-scripts/basic-curl-form-filling-tutorial/php-newbie-form-fill-tutorial.php
        #
    else:
        #
        # i tried even mechanize
        # but I do not know how to set it either
        #
        cookies = mechanize.CookieJar()
        opener = mechanize.build_opener(mechanize.HTTPCookieProcessor(cookies))

    params = urllib.urlencode(dict(login=_name, password=_password))
    f = opener.open(_url, params)
    data = f.read()
    f.close()
    return opener

我试图将adheaders移动到不同的地方,但它没有帮助。也许它可以通过机械化完成,但我不确定如何。

感谢您的帮助。 :)

1 个答案:

答案 0 :(得分:1)

python docs页面具有使用方括号构建开启者的这种格式。你将它传递给{(...)}

import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
opener.open('http://www.example.com/')