是否有方法/在线服务/数据库可用于将域名(例如maxmind.com)转换为公司名称“Max Mind Inc.” ?
如果没有,有人可以建议采用逻辑编程方式来解决问题吗?
我正在考虑以下几点:
有什么建议吗?
答案 0 :(得分:16)
毛茸茸的问题!
在许多情况下,WHOIS查询将失败:共享服务器,Akamai或其他CDN,与公司无关的域等。我来自网络代理商的背景,我可以告诉你一个大的事实(两个)数字)公司不关心拥有所有域名的百分比 - 他们让网络代理处理它,特别是与小型促销网站有关。
我最好的建议就是这样。获取主页或站点地图(如果有)。寻找版权符号。这可以是有限数量的形式:“& copy;”,“(c)”,“©”。声明表通常是“公司(c)年”或“(c)年公司”。从这里你可以得到公司。
它并不适用于所有情况,但它可能是您的最佳选择。
答案 1 :(得分:6)
我会将Sklivvz建议与至少标题标签检查结合起来,如果可能的话,将Whois记录结合起来。
如果你解析stackoverflow.com的版权声明,你最终会得到“stackoverflow.com”或“stackoverflow.com LLC”,这有点无关紧要。
在maxmind.com示例中,如果您解析法律声明“Copyright©2009 MaxMind,Inc。”你最终得到“MaxMind”或“MaxMind,Inc。”,如果你与标题标签“MaxMind的地理定位和在线欺诈预防”相结合,那么两个地方出现的唯一一个词就是MaxMind。
此外domaintools.com将域名分解为单词(每个人都可以更改它),您可以解析此页面并获取“真实”名称,例如:
http://whois.domaintools.com/maxmind.com = Max Mind
http://whois.domaintools.com/dabbledb.com = Dabble Db
http://whois.domaintools.com/domaintools.com = Domain Tools
http://whois.domaintools.com/stackoverflow.com = Stack Overflow
http://whois.domaintools.com/joelonsoftware.com = Joel On Software
在可用时,aboutus.org也可能是一个非常好的参考:
http://aboutus.org/maxmind.com = MaxMind LLC
http://aboutus.org/dabbledb.com = ...
http://aboutus.org/domaintools.com = DomainTools.com
http://aboutus.org/stackoverflow.com = Stack Overflow AG
http://aboutus.org/joelonsoftware.com = Fog Creek Software Inc.
答案 2 :(得分:5)
查看可从域名获取公司名称的Clearbit API:https://clearbit.com/#features
此外,LinkedIn也会浮现在脑海中。
答案 3 :(得分:0)
2)我认为第2点是不可能的。页面标题并不总是包含公司名称。和其他元素可以在页面的其他位置(如果确实有一个带有公司名称的标签,而不仅仅是一个图像)。网络是动态的搜索。
3)真的有一个公司页面没有匹配的whois条目吗? 私人有很多域名(没有公司名称)。自己域名上的博客就是这样一个样本。你在whois上找到了注册人的姓名,但你不知道,如果这个人是该页面的作者。
为什么您需要这样的服务而且不仅仅使用域名?