我正在使用Python 3.7和Django。我想提取URL的域部分。因为“域”可能不是正确的词,所以我的意思是URL是否为
www.yahoo.com
我想提取“ yahoo.com”。如果网址是
www.indepednet.co.uk
我想提取“ independent.co.uk”。不知道什么是正确的术语。我尝试过
ext = tldextract.extract(article_stat.article.url)
self.domain = ext.domain.lower()
但这仅提取一个单词。在第一个示例中,它仅提取“ yahoo”。提取域的正确方法是什么?
答案 0 :(得分:0)
您缺少suffix。
要执行您想做的事情,请尝试以下操作:
ext = tldextract.extract(article_stat.article.url)
self.domain = ext.domain.lower() + ext.suffix.lower()
看起来您也可以将第二行替换为self.domain = ext.registered_domain