我正在编写一个脚本来分析域名列表的国家/地区(例如third.second.first
)。数据集非常陈旧,并且在python中无法通过socket.gethostbyname(domain_str)
找到许多完全限定的域名。以下是我提出的一些替代方案:
second.first
的IP,则检索third.second.first
的IP
无法找到然后找到那个ip的国家
我的问题是:
谢谢。
答案 0 :(得分:2)
我建议使用geolite2
模块:
所以你可以这样做:
#!/usr/bin/python
import socket
from geolite2 import geolite2
def origin(ip, domain_str, result):
print("{0} [{1}]: {2}".format(domain_str.strip(), ip, result))
def getip(domain_str):
ip = socket.gethostbyname(domain_str.strip())
reader = geolite2.reader()
output = reader.get(ip)
result = output['country']['iso_code']
origin(ip, domain_str, result)
with open("/path/to/hostnames.txt", "r") as ins:
for domain_str in ins:
try:
getip(domain_str)
except socket.error as msg:
print("{0} [could not resolve]".format(domain_str.strip()))
if len(domain_str) > 2:
subdomain = domain_str.split('.', 1)[1]
try:
getip(subdomain)
except:
continue
geolite2.close()
<强>输出:强>
bing.com [204.79.197.200]: US
dd15-028.compuserve.com [could not resolve]
compuserve.com [149.174.98.149]: US
google.com [172.217.11.78]: US