在网页上,当分别嵌入<img>
,<link>
和<script>
标记时,客户的网络浏览器会加载图片,css和javascript等资源。
资源网址可以采用不同的形式,也可以是完整的网址,例如:
http://cdn.mysite.com/images/animage.jpg
它可以是相对路径:
images/animage.jpg
../images/animage.jpg
或只是对根
的引用/images/animage.jpg
我怎样才能在python中创建一个函数,它接受页面的URL和资源的URL,并确保返回完整的URL?
例如:
def resource_url(page,resource):
## if the resource is a full URL, return that
## if not, use the page URL and the resource to return the full URL
答案 0 :(得分:1)
from urlparse import urljoin
def resource_url(page, resource):
if not resource.startswith(page):
# doesn't start with http://example.com
resource = urljoin(page, resource)
return resource