用于URL的python正则表达式" www.example.com"

时间:2017-06-22 15:09:32

标签: python-3.x

我需要python regex用于" www.example.com " (没有引号)。 示例可以是任何字符串。 我需要它之前没有任何其他文字" www "之后" .com "

1 个答案:

答案 0 :(得分:1)

您可以使用标准库urllib.parse.urlparse中的专用函数:

>>> from urllib.parse import urlparse
>>> parts = urlparse('http://www.example.org')
>>> parts
ParseResult(scheme='http', netloc='www.example.org', path='', params='', query='', fragment='')
>>> parts.netloc
'www.example.org'

或者您可以将此正则表达式用于文本:

>>> import re
>>> regexp = re.compile(r'\s*(www\.[^:\/\n]+\.com)\s*')
>>> urls = regexp.findall('Hello https://www.mywebsite.com/index.py?q=search bonjour...')
>>> urls
['www.mywebsite.com']