Question

我很好奇是否有更简单的方法从网址中删除特定参数。我想出的是以下内容。这看起来有点冗长。使用的图书馆或更多的pythonic版本赞赏。

parsed = urlparse(url)
if parsed.query != "":
    params = dict([s.split("=") for s in parsed.query.split("&")])
    if params.get("page"):
        del params["page"]
    url = urlunparse((parsed.scheme,
                      None,
                      parsed.path,
                      None,
                      urlencode(params.items()),
                      parsed.fragment,))
    parsed = urlparse(url)

Answer 1

使用urlparse.parse_qsl()破解查询字符串。您可以一次过滤：

params = [(k,v) for (k,v) in parse_qsl(parsed.query) if k != 'page']

Answer 2

我创建了一个小型帮助器类来以结构化方式表示URL：

import cgi, urllib, urlparse

class Url(object):
    def __init__(self, url):
        """Construct from a string."""
        self.scheme, self.netloc, self.path, self.params, self.query, self.fragment = urlparse.urlparse(url)
        self.args = dict(cgi.parse_qsl(self.query))

    def __str__(self):
        """Turn back into a URL."""
        self.query = urllib.urlencode(self.args)
        return urlparse.urlunparse((self.scheme, self.netloc, self.path, self.params, self.query, self.fragment))

然后你可以这样做：

u = Url(url)
del u.args['page']
url = str(u)

更多相关信息：Web development peeve。

有没有更好的方法在Python中编写此URL操作？

2 个答案: