如何从python中的资源URL获取完整的URL

时间:2012-02-23 14:09:16

标签: python url

在网页上,当分别嵌入<img><link><script>标记时,客户的网络浏览器会加载图片,css和javascript等资源。

资源网址可以采用不同的形式,也可以是完整的网址,例如:

http://cdn.mysite.com/images/animage.jpg

它可以是相对路径:

images/animage.jpg
../images/animage.jpg

或只是对根

的引用
/images/animage.jpg

我怎样才能在python中创建一个函数,它接受页面的URL和资源的URL,并确保返回完整的URL?

例如:

def resource_url(page,resource):
    ## if the resource is a full URL, return that
    ## if not, use the page URL and the resource to return the full URL

1 个答案:

答案 0 :(得分:1)

from urlparse import urljoin

def resource_url(page, resource):
  if not resource.startswith(page):
    # doesn't start with http://example.com
    resource = urljoin(page, resource)
  return resource