在redshift

时间:2016-05-11 03:32:55

标签: sql amazon-redshift geolite2

我遇到了一个问题,我一直试图解决这个问题,我已经搜索了一些类似于我想做的事情,但无法确切地知道如何做到这一点,

我有大约250M的ip地址,我想查看maxmind geolite2数据,以便我可以告诉每个IP地址来自哪个国家/地区,

我已使用talend

将所有数据导入我的Redshift群集
table a has ID and 'ipaddress' ie 10.0.0.5
table b (maxmind) has country name and IP range as expressed as 10.0.0.0/24

考虑到源数据源的大小,我如何使用Redshift SQL来匹配这两个?

编辑:继承geolite2数据https://dev.maxmind.com/geoip/geoip2/geolite2/

的链接

1 个答案:

答案 0 :(得分:2)

您可以尝试使用Amazon Redshift的Import Custom Python Library Modules加载netaddr library的功能。然后,您可以在用Python编写的用户定义函数中使用该库。

另请参阅:IP Range to CIDR conversion in Python?