我需要python regex用于" www.example.com " (没有引号)。 示例可以是任何字符串。 我需要它之前没有任何其他文字" www "之后" .com "
答案 0 :(得分:1)
您可以使用标准库urllib.parse.urlparse中的专用函数:
>>> from urllib.parse import urlparse
>>> parts = urlparse('http://www.example.org')
>>> parts
ParseResult(scheme='http', netloc='www.example.org', path='', params='', query='', fragment='')
>>> parts.netloc
'www.example.org'
或者您可以将此正则表达式用于文本:
>>> import re
>>> regexp = re.compile(r'\s*(www\.[^:\/\n]+\.com)\s*')
>>> urls = regexp.findall('Hello https://www.mywebsite.com/index.py?q=search bonjour...')
>>> urls
['www.mywebsite.com']