有没有更好的方法在Python中编写此URL操作?

时间:2010-05-20 12:01:33

标签: python url parsing

我很好奇是否有更简单的方法从网址中删除特定参数。我想出的是以下内容。这看起来有点冗长。使用的图书馆或更多的pythonic版本赞赏。

parsed = urlparse(url)
if parsed.query != "":
    params = dict([s.split("=") for s in parsed.query.split("&")])
    if params.get("page"):
        del params["page"]
    url = urlunparse((parsed.scheme,
                      None,
                      parsed.path,
                      None,
                      urlencode(params.items()),
                      parsed.fragment,))
    parsed = urlparse(url)

2 个答案:

答案 0 :(得分:10)

使用urlparse.parse_qsl()破解查询字符串。您可以一次过滤:

params = [(k,v) for (k,v) in parse_qsl(parsed.query) if k != 'page']

答案 1 :(得分:8)

我创建了一个小型帮助器类来以结构化方式表示URL:

import cgi, urllib, urlparse

class Url(object):
    def __init__(self, url):
        """Construct from a string."""
        self.scheme, self.netloc, self.path, self.params, self.query, self.fragment = urlparse.urlparse(url)
        self.args = dict(cgi.parse_qsl(self.query))

    def __str__(self):
        """Turn back into a URL."""
        self.query = urllib.urlencode(self.args)
        return urlparse.urlunparse((self.scheme, self.netloc, self.path, self.params, self.query, self.fragment))

然后你可以这样做:

u = Url(url)
del u.args['page']
url = str(u)

更多相关信息:Web development peeve