在Python中,如何提取URL的域部分?

时间:2019-04-04 20:54:50

标签: django python-3.x parsing uri

我正在使用Python 3.7和Django。我想提取URL的域部分。因为“域”可能不是正确的词,所以我的意思是URL是否为

www.yahoo.com

我想提取“ yahoo.com”。如果网址是

www.indepednet.co.uk

我想提取“ independent.co.uk”。不知道什么是正确的术语。我尝试过

ext = tldextract.extract(article_stat.article.url)
self.domain = ext.domain.lower()

但这仅提取一个单词。在第一个示例中,它仅提取“ yahoo”。提取域的正确方法是什么?

1 个答案:

答案 0 :(得分:0)

您缺少suffix

要执行您想做的事情,请尝试以下操作:

ext = tldextract.extract(article_stat.article.url)
self.domain = ext.domain.lower() + ext.suffix.lower()

看起来您也可以将第二行替换为self.domain = ext.registered_domain