Question

在一个加载的网页地址中，我只想要基本网址并删除尾部。我怎么得到它，请帮助我。

Answer 1

检出urllib.parse模块：

https://docs.python.org/3/library/urllib.parse.html

您可以使用urlparse或urlsplit方法将url分解为组件...

假设您具有以下网址：http://example.com/foo?bar=1#baz

它由几个部分组成：协议方案，网络位置，路径，参数，查询字符串和片段。

例如：

from urllib.parse import urlparse

>>> url = 'http://example.com/foo?bar=1#baz'
>>> o = urlparse(url)
>>> o
ParseResult(scheme='http', netloc='example.com', path='/foo', params='', query='bar=1', fragment='baz')
>>> o.netloc
'example.com'

如何在python split中仅获取基本网址（如www.example.com）

1 个答案: