如何在python中规范化或解码URL?

时间:2013-06-25 13:46:23

标签: python url

我有如下链接

http%253A%252F.....25252520.doc

我如何将它转换为python中的普通链接?..链接有很多编码的东西..

2 个答案:

答案 0 :(得分:2)

使用urllib.unquote()

  

%xx转义符替换为单字符等效值。

看起来像,好像你有一个双重或三倍编码的URL; http://部分已编码为http%253A%252F,其解码为http%3A%2F,后者又变为http:/。 URL本身可能包含另一个编码阶段,但您没有与我们分享足够的实际URL来确定。

答案 1 :(得分:2)

两次申请urllib.unquote

>>> import urllib
>>> strs = urllib.unquote("http%253A%252F.....25252520.doc")
>>> urllib.unquote(strs)
'http:/.....25252520.doc'