如何在Python中使用referer和href查找url?

时间:2009-08-09 01:47:29

标签: python regex string url href

假设我有

window_location = 'http://stackoverflow.com/questions/ask'
href = '/users/48465/jader-dias'

我想获得

link = 'http://stackoverflow.com/users/48465/jader-dias'

我如何用Python做到这一点?

它必须像在浏览器中一样工作

1 个答案:

答案 0 :(得分:6)

>>> import urlparse
>>> urlparse.urljoin('http://stackoverflow.com/questions/ask',
...                  '/users/48465/jader-dias')
'http://stackoverflow.com/users/48465/jader-dias'

来自urlparse.urljoin的文档页面:

  

urlparse.urljoin(base,url [,   allow_fragments])

     

通过组合“基本URL”(基础)来构建完整(“绝对”)URL   另一个URL(网址)。非正式地,这个   使用基本URL的组件   特别是寻址方案,   网络位置和(部分)   路径,提供缺少的组件   相对URL。

     

如果url是绝对URL(即,   以//或scheme://开头,   url的主机名和/或方案将是   出现在结果中。