从完整域名中查找国家/地区

时间:2017-07-14 17:05:18

标签: python dns

我正在编写一个脚本来分析域名列表的国家/地区(例如third.second.first)。数据集非常陈旧,并且在python中无法通过socket.gethostbyname(domain_str)找到许多完全限定的域名。以下是我提出的一些替代方案:

  1. 如果second.first的IP,则检索third.second.first的IP 无法找到然后找到那个ip的国家
    • 这似乎不是一个好主意,因为dns A记录可以将子域映射到与其主域不同的ip。
  2. 检测域名的国家/地区代码。例如如果它是 .jp,则来自日本
  3. 我的问题是:

    • 第一种方法是否可以接受?
    • 还有其他方法可以检索域名的国家/地区信息吗?

    谢谢。

1 个答案:

答案 0 :(得分:2)

我建议使用geolite2模块:

  

https://pypi.python.org/pypi/maxminddb-geolite2

所以你可以这样做:

#!/usr/bin/python

import socket
from geolite2 import geolite2

def origin(ip, domain_str, result):
    print("{0} [{1}]: {2}".format(domain_str.strip(), ip, result))

def getip(domain_str):
    ip = socket.gethostbyname(domain_str.strip())
    reader = geolite2.reader()      
    output = reader.get(ip)
    result = output['country']['iso_code']
    origin(ip, domain_str, result)

with open("/path/to/hostnames.txt", "r") as ins:
    for domain_str in ins:
        try:
            getip(domain_str)
        except socket.error as msg:
            print("{0} [could not resolve]".format(domain_str.strip())) 
            if len(domain_str) > 2:
                subdomain = domain_str.split('.', 1)[1]
                try:
                    getip(subdomain)
                except:
                    continue

geolite2.close()

<强>输出:

bing.com [204.79.197.200]: US
dd15-028.compuserve.com [could not resolve]
compuserve.com [149.174.98.149]: US
google.com [172.217.11.78]: US