我有两个URL,我使用urlparse()从中提取主机名。结果是: URL1 ='ads.indiaresults.com'和URL2 ='haryana.indiaresults.com'
现在我如何检查它们是否来自同一个域或网站。我必须制作一个通用方法,以便它适用于所有URL,因为有些时候主机名是这样的: (www.google.com,www.e-tutes.com)
答案 0 :(得分:1)
这可以是一个答案:
拆分您的网址:
URL1Split = URL1.split(".")
URL2Split = URL2.split(".")
然后,反转列表:
a = URL1Split[::-1]
b = URL2Split[::-1]
现在,您只需选择2个第一项来获取域名:
domain1 = a[1] + "." + a[0]
domain2 = b[1] + "." + b[0]
如果您需要,这是一个功能:
def compDom(URL1,URL2):
URL1Split = URL1.split(".")
URL2Split = URL2.split(".")
a = URL1Split[::-1]
b = URL2Split[::-1]
domain1 = a[1] + "." + a[0]
domain2 = b[1] + "." + b[0]
if domain1 == domain2:
return 1
else:
return 0