我如何知道网页或网址的地理来源?

时间:2011-02-08 22:23:43

标签: html http web-crawler

我正在构建一个网络爬虫,我正在试图弄清楚网页的位置。我的意思是,我可以检查域名(例如,来自阿根廷的.com.ar ar)但是还有其他站点,其他域名(.com,.net)也是阿根廷人,这些例子就是www.taringa 。净。是阿根廷网站,但有.net域名。

那我该怎么做呢?

感谢。

2 个答案:

答案 0 :(得分:2)

  • 通过IP进行地理位置定位。反过来 查找IP地址,你可以 获得一个地理位置。这些 服务需要花钱,而且只会 告诉你物理服务器的位置 托管。

  • 在域上做一个whois。它会 告诉你网站的位置 注册

但请记住, “哪里是来自”的网页没有任何意义。网络没有地理边界。我可以在加利福尼亚州圣何塞经营一个西班牙语网站,并在加拿大注册域名联系人。您将无法知道我的网站是针对智利用户的。

答案 1 :(得分:2)

您可以在命令行上使用whois查询 - 或根据结果向whois.arin.net和whois.xxxx.xxx发出请求。如果我将www.taringa.net映射到IP,我会得到这个:

www.taringa.net.    300 IN  A   190.210.132.53

并在那上面运行whois:

whois 190.210.132.53

给了我大量的输出:

inetnum:     190.210.132/24
status:      reallocated
owner:       WIROOS SRL
ownerid:     AR-WISR1-LACNIC
responsible: ALBERTO NAKAYAMA
address:     GRAL MIGUEL DE AZCUENAGA, 71, 4 A
address:     C1029AAA - BUENOS AIRES -
country:     AR
phone:       +54 011 30973059 [3059]

这通常适用于任何ip。