对URL参数进行解码

时间:2012-06-26 20:17:40

标签: python django web-services url

我正在和一个曾经向我发送HTTP字符串的服务器说话:

/path/to/my/handler/?action-query&id=112&type=vca&info=ch=0&type=event&ev16[sts=begin (...)

所以“info”GET参数包括“=”和“&”字符。这是相当不正统的,但我们为它写了一个解析器。但是,最近他们决定对其中的一部分进行编码,所以现在字符串看起来像这样..

/path/to/my/handler/?action=query&id=112&type=vca&info=ch%3D0%26type%3Devent%26ev46[sts%3Dbegin (...)

这打破了我们的解析器,它需要一个像第一个一样的字符串。

我可以以某种方式“解码”字符串,以便我可以使用旧代码(这样在我们重新编写解析器时它不会被破坏)吗?

根据下面的答案,我们可以使用urllib.unquote()来清理字符串。但是,我们依赖于request.GET,它基于第一个字符串进行设置。是否可以根据新转换的字符串重建GET对象,或以某种方式强制它重新评估?

1 个答案:

答案 0 :(得分:5)

我怀疑你想要的是unquote模块中的urllib函数。

>>> s = '/path/to/my/handler/?action=query&id=112&type=vca&info=ch%3D0%26type%3Devent%26ev46[sts%3Dbegin'
>>> import urllib
>>> urllib.unquote(s)
'/path/to/my/handler/?action=query&id=112&type=vca&info=ch=0&type=event&ev46[sts=begin'

编辑:我对Django不太熟悉,但Request and response object section of their docs声明如下:

  

QueryDict实例是不可变的,除非您创建它们的副本()。这意味着您无法直接更改request.POST和request.GET的属性。

根据我对这些文档的有限阅读,您可以将unquote()函数应用于HttpRequest.body属性,并从结果中构建新的QueryDict(并可能使用它会在必要时更新你当前的那个。)