将网址与斜线和www进行比较

时间:2014-01-27 16:11:01

标签: python url web uri

下面列出的网址是否相同或相等?

1. http://example.com
2. http://www.example.com
3. http://example.com/

如果python中的这些url是相同的,如何比较这些url?

提前致谢。

2 个答案:

答案 0 :(得分:2)

您可以将整个网址拆分为多个部分:

>>> import urlparse
>>> urlparse.urlparse('http://www.example.com')
ParseResult(scheme='http', netloc='www.example.com', path='', params='', query='', fragment='')
>>> urlparse.urlparse('http://example.com')
ParseResult(scheme='http', netloc='example.com', path='', params='', query='', fragment='')

如果您假设所有网址都来自同一个网址,但有时会以“www”为前缀,则可以只比较“路径”组件。这取决于你的具体任务。

答案 1 :(得分:0)

无需重新发明轮子。

使用此REGEX设计用于解析URL。

http://daringfireball.net/2010/07/improved_regex_for_matching_urls