我遇到了一个问题,我一直试图解决这个问题,我已经搜索了一些类似于我想做的事情,但无法确切地知道如何做到这一点,
我有大约250M的ip地址,我想查看maxmind geolite2数据,以便我可以告诉每个IP地址来自哪个国家/地区,
我已使用talend
将所有数据导入我的Redshift群集table a has ID and 'ipaddress' ie 10.0.0.5
table b (maxmind) has country name and IP range as expressed as 10.0.0.0/24
考虑到源数据源的大小,我如何使用Redshift SQL来匹配这两个?
编辑:继承geolite2数据https://dev.maxmind.com/geoip/geoip2/geolite2/
的链接答案 0 :(得分:2)
您可以尝试使用Amazon Redshift的Import Custom Python Library Modules加载netaddr library的功能。然后,您可以在用Python编写的用户定义函数中使用该库。