我试图创建一个脚本,动态比较互联网上的网站,并确定它们是否属于同一根。
示例:
一个。 " apple.com"和" itunes.apple.com"具有相同的根" apple.com"
B中。 " apple.com.gr"和" apple.com"不是同一个根。
使这无法解决的是SLDs的存在。
这就是我的意思:
假设您正在尝试比较由组件分隔的两个主机字符串"。"
分离前:
"itunes.apple.com"
分离后:
"itunes" . "apple" . "com"
这绝对没有意义,因为它可能是任何东西。
"谷歌" 。 "玉米"和" apple" 。 "玉米"分享相同的第一个组件" com"。
这意味着(A)您有两个共享相同根目录的网站或(B)存在SLD。
一个。 "苹果" 。 "玉米"和" itunes" 。 "苹果" 。 "玉米"拥有相同的根" apple.com"
B中。 "谷歌" 。 "玉米" 。 " GR"和" facebook" 。 "玉米" 。 " GR"分享相同的SLD。
解决这个问题的唯一方法是了解所有SLD的列表,这很难看。
修改
比较A
"的苹果" 。 " CO" 。 " UK"
"的雅虎" 。 " CO" 。 " UK"
比较B
" FTP" 。 "的 ACME " 。 "组织"
" SQL" 。 "的 ACME " 。 "组织"
我无法想到一个脚本,这个脚本将导致在比较A中识别出域与不同的根,并且在比较B中具有相同的根,而不知道" co.uk"是一个SLD。