Question

我正在尝试通过加入一些动态组件来构建URL。在我的情况下，我想过使用像os.path.join() BUT这样的URL。从研究中我发现urlparse.urljoin()做了同样的事情。但是，看起来它一次只需要两个参数。

到目前为止我有以下内容可行，但看起来很重复：

    a = urlparse.urljoin(environment, schedule_uri)
    b = urlparse.urljoin(a, str(events_to_hours))
    c = urlparse.urljoin(b, str(events_from_date))
    d = urlparse.urljoin(c, str(api_version))
    e = urlparse.urljoin(d, str(id))
    url = e + '.json'

输出= http://example.com/schedule/12/20160322/v1/1.json

上述作品，我试图通过这种方式缩短它：

url_join_items = [environment, schedule_uri, str(events_to_hours),
                  str(events_from_date), str(api_version), str(id), ".json"]
new_url = ""
for url_items in url_join_items:
    new_url = urlparse.urljoin(new_url, url_items)

输出：http://example.com/schedule/.json

但第二个实现不起作用。请建议我如何解决这个或更好的方法。

编辑1： reduce解决方案的输出看起来像这样（不幸的是）：输出：http://example.com/schedule/.json

Answer 1

使用加入

您是否尝试过"/".join(url_join_items)。 http不总是使用正斜杠吗？您可能需要手动设置前缀＆＃34; https：//＆＃34;和后缀，但是。

类似的东西：

url = "https://{}.json".format("/".join(url_join_items))

使用reduce和urljoin

这是关于SO的related question，它在某种程度上解释了urljoin实施背后的想法。您的用例似乎不是最合适的。

使用reduce和urljoin时，我不确定它会执行问题的意图，这在语义上类似os.path.join，但对于网址。请考虑以下事项：

from urllib.parse import urljoin
from functools import reduce

parts_1 = ["a","b","c","d"]
parts_2 = ["https://","server.com","somedir","somefile.json"]
parts_3 = ["https://","server.com/","somedir/","somefile.json"]

out1 = reduce(urljoin, parts_1)
print(out1)

d

out2 = reduce(urljoin, parts_2)
print(out2)

https:///somefile.json

out3 = reduce(urljoin, parts_3)
print(out3)

https:///server.com/somedir/somefile.json

请注意，除了额外的＆＃34; /＆＃34;在https前缀之后，第三个输出可能最接近提问者的意图，除非我们必须完成使用分隔符格式化部件的所有工作。

Answer 2

url = reduce(urlparse.urljoin, url_join_items)怎么样？

Answer 3

考虑到[DataContract] Public class Organization { [DataMember] Public Employees Employees {get;set;} } [CollectionDataContract(ItemName="Employee")] public class Employees: List<string> {}是按顺序列出的URL部分的列表，这是一个愚蠢但可行的解决方案

parts

我希望my_url = '/'.join(parts).replace('//', '/').replace(':/', '://')有一个replace选项，但是它不希望第二个是恢复from双斜杠

令人高兴的是，您不必担心零件已经有（或没有）任何斜线

Answer 4

我还需要类似的东西，并提出了以下解决方案：

from urllib.parse import urljoin, quote_plus

def multi_urljoin(*parts):
    return urljoin(parts[0], "/".join(quote_plus(part.strip("/"), safe="/") for part in parts[1:]))

print(multi_urljoin("https://server.com", "path/to/some/dir/", "2019", "4", "17", "some_random_string", "image.jpg"))

这将打印'https://server.com/path/to/some/dir/2019/4/17/some_random_string/image.jpg'

Python：加入多个组件来构建URL

4 个答案: