我找到了一种方法来下载每个TLD的所有域名,以便将它们存储在一个大型数据库中(我想每天更新这个数据库)。
首先,我试图找到一种方法来检索TLD的完整列表。 经过一些搜索,我发现了两个列表: - https://www.iana.org/domains/root/db - http://data.iana.org/TLD/tlds-alpha-by-domain.txt 第一个问题是,为什么有2个列表具有不同的条目数(1576个条目和1544个)?我怎么知道哪些列表是好的(或者可能都不完整)?
然后,我想下载每个TLD的子域名的完整列表。 我发现https://czds.icann.org/en集中了大多数TLD的区域文件(并允许我们在创建帐户后下载列表)。
不幸的是,并非所有TLD都在CZDS中出现,所以我应该联系每个寄存器(对于这个不在CZDS中的TLD)自己下载他们的列表吗? 我真的不知道,注册簿是否有义务维护和分享这种清单?
我还看到一些付费网站:https://domains-index.com/
你对这一切有什么看法?
Thx家伙:)
答案 0 :(得分:0)
你在问多种事情。第一部分在你在这里发布的另一个问题中提到,我也回复了,所以请看。
初步说明:负责每个TLD的组织称为"注册表"而不是"注册"。
至于第二部分:只有gTLD注册管理机构与ICANN签订了合同,因此被授权每天访问其区域文件的内容。这主要是CZDA,因为这集中了这个任务(以前你必须逐个联系每个注册表并分别与每个注册表签订合同)。
第一要点:区域文件的内容是不" TLD"的内容。因为各种原因,您可以注册域名而不发布域名。所以会有一些百分比的差异,你会错过一些领域。
现在,通用顶级域名并不是所有顶级域名。 ccTLD不与ICANN签订合同,因此未被授权发布此数据。尽管如此,他们中的一些人正在这样做,但这种情况更为罕见。有些人提供每日更改,因此如果你做得足够长,你可以重建整个区域文件。
因此无法下载绝对所有顶级域名(TLD)联系人的任务。您没有提供有关您的问题的任何背景信息以及您尝试这样做的原因,因此很难为您提供选项。当然,其他一些商业实体已经下载并编译了各种数据,可以为您提供,包括有时有历史,但肯定不是免费的。
你可以想象很多战术。一个非常简单的方法是使用您在其他TLD中测试区域文件的TLD中的域名(DNS查询很便宜),因为您经常在多个TLD中找到相同的标签。当然,你不会得到100%正确的结果,但这是一个开始。