urllib2 - 发布请求

时间:2012-03-02 23:11:41

标签: python urllib2 http-request

我尝试使用urllib2执行简单的POST请求。 但是服务器响应表明它收到一个简单的GET。我检查了传出请求的类型,但它设置为POST。
为了检查服务器是否像我期望的那样,我尝试使用连接到url的(以前的POST-)数据执行GET请求。这给了我预期的答案。
有没有人知道我误解了什么?

def connect(self):
    url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    header = { 'User-Agent' : user_agent }

    values = {
      'city_from' : 69,
      'radius_from' : 0,
      'city_to' : 263,
      'radius_to' : 0,
      'date' : 'date',
      'day' : 5,
      'month' : 03,
      'year' : 2012,
      'tolerance' : 0
    }

    data = urllib.urlencode(values)
    # req = urllib2.Request(url+data, None, header) # GET works fine
    req = urllib2.Request(url, data, header)  # POST request doesn't not work

    self.response = urllib2.urlopen(req)

这似乎是一个问题,就像这里讨论的那样:Python URLLib / URLLib2 POST但我很确定在我的情况下,尾随斜线不会丢失。 ;)

我担心这可能是一个愚蠢的误解,但我已经想好几个小时了!



编辑:打印的便利功能:

def response_to_str(response):
    return response.read()

def dump_response_to_file(response):
    f = open('dump.html','w')
    f.write(response_to_str(response))



编辑2:决议:

我找到了一个工具来捕捉与网站http://fiddler2.com/fiddler2/的真实互动。显然,服务器从输入表单中获取数据,重定向几次,然后发出GET请求,并将此数据简单地附加到URL。 urllib2一切都很好,我为误用你的时间而道歉!

4 个答案:

答案 0 :(得分:16)

您需要检查的事项:

  • 您确定要发布到正确的网址吗?
  • 您确定无需登录即可检索结果吗?
  • 向我们展示一些不同帖子值的示例输出。

您可以使用Firefox的Firebug或Google Chromes DevTools找到正确的帖子网址。

我为您提供了一些支持Cookie的代码,以便您可以先登录并使用Cookie通过帖子参数发出后续请求。

最后,如果您可以向我们展示一些示例HTML输出,那将使生活更轻松。

这是我的代码,到目前为止,对我来说非常可靠地发布到大多数网页,包括受CSRF/XSRF保护的网页(只要你能够正确地找出什么发布和发布 (哪个URL)。

import cookielib
import socket
import urllib
import urllib2

url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'
http_header = {
                "User-Agent" : "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.46 Safari/535.11",
                "Accept" : "text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,text/png,*/*;q=0.5",
                "Accept-Language" : "en-us,en;q=0.5",
                "Accept-Charset" : "ISO-8859-1",
                "Content-type": "application/x-www-form-urlencoded",
                "Host" : "www.mitfahrgelegenheit.de",
                "Referer" : "http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/"
                }

params = {
  'city_from' : 169,
  'radius_from' : 0,
  'city_to' : 263,
  'radius_to' : 0,
  'date' : 'date',
  'day' : 5,
  'month' : 03,
  'year' : 2012,
  'tolerance' : 0
}

# setup socket connection timeout
timeout = 15
socket.setdefaulttimeout(timeout)

# setup cookie handler
cookie_jar = cookielib.LWPCookieJar()
cookie = urllib2.HTTPCookieProcessor(cookie_jar)

# setup proxy handler, in case some-day you need to use a proxy server
proxy = {} # example: {"http" : "www.blah.com:8080"}

# create an urllib2 opener()
#opener = urllib2.build_opener(proxy, cookie) # with proxy
opener = urllib2.build_opener(cookie) # we are not going to use proxy now

# create your HTTP request
req = urllib2.Request(url, urllib.urlencode(params), http_header)

# submit your request
res = opener.open(req)
html = res.read()

# save retrieved HTML to file
open("tmp.html", "w").write(html)
print html

答案 1 :(得分:1)

只是为了结束这个问题:
问题确实是,服务器没有预料到POST请求(尽管应该考虑用例)。所以(再次)框架没有被打破。 ;)

答案 2 :(得分:0)

尝试将标题添加到标题中:

   'Content-type': 'application/x-www-form-urlencoded'

答案 3 :(得分:0)

尝试从您的网址中删除尾随斜杠:

url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html'

可能是您发送POST请求的服务器脚本实际上不支持POST请求。