如何在python split中仅获取基本网址(如www.example.com)

时间:2018-08-12 21:07:17

标签: python-3.x selenium split

在一个加载的网页地址中,我只想要基本网址并删除尾部。我怎么得到它,请帮助我。

1 个答案:

答案 0 :(得分:0)

检出urllib.parse模块:

您可以使用urlparseurlsplit方法将url分解为组件...

假设您具有以下网址:http://example.com/foo?bar=1#baz

它由几个部分组成:协议方案,网络位置,路径,参数,查询字符串和片段。

例如:

from urllib.parse import urlparse

>>> url = 'http://example.com/foo?bar=1#baz'
>>> o = urlparse(url)
>>> o
ParseResult(scheme='http', netloc='example.com', path='/foo', params='', query='bar=1', fragment='baz')
>>> o.netloc
'example.com'